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Introdução 

Os conceitos e métodos estatísticos não são apenas úteis, como também indispensáveis na 
compreensão do mundo ao nosso redor. Eles fornecem meios de obtenção de novas 
percepções no que diz respeito ao comportamento de diversos fenômenos que você en- 
contrará em seu campo de especialização em engenharia ou ciência. 

A disciplina estatística nos ensina a fazer julgamentos inteligentes e a tomar decisões 
na presença de incertezas e variações. Sem incertezas ou variações, haveria pouca neces- 
sidade de estatísticos ou métodos estatísticos. Se cada componente de um determinado 
tipo tivesse exatamente o mesmo tempo de vida, se todos os resistores produzidos por um 
determinado fabricante tivessem o mesmo valor de resistência, se as determinações de pH 
de espécimes de solo de um local determinado fornecessem resultados idênticos, e assim 
por diante, então uma única observação revelaria todas as informações desejadas. 

Uma manifestação interessante das variações surge ao longo dos testes de desem- 
penho de emissões em motores automotivos. Os requisitos de custos e tempo do FTP 
(Federal Test Procedure) impedem seu uso generalizado em programas de inspeção vei- 
culares. Como resultado, muitas agências desenvolveram testes mais rápidos e baratos, 
que, espera-se, reproduzam os resultados do FTP. De acordo com o artigo de jornal "Mo- 
tor Vehicle Emissions Variability" ( J . of the Air and Waste Mgrnt. Assoe., 1 996: 667-675), 
a aceitação do FTP como um padrão universal leva à crença de que medidas repetidas no 
mesmo veículo terão resultados idênticos (ou quase idênticos). Os autores do artigo 
aplicaram o FTP a sete veículos caracterizados como "altos emissores". Seguem os resul- 
tados de um dos veículos: 

HC (gm/milha) 13,8 18,3 32,2 32,5 

CO(gm/milha) 118 149 232 236 
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A variação substancial nas medidas de HC e CO apresenta dúvidas consideráveis 
sobre a sabedoria popular e dificulta a elaboração de avaliações precisas sobre níveis 
de emissão. 

Como as técnicas estatísticas podem ser usadas para obter informações e tirar con- 
clusões? Suponha, por exemplo, que um engenheiro de materiais tenha desenvolvido um 
revestimento para retardar a corrosão em tubulações de metal sob circunstâncias especifi- 
cadas. Se esse revestimento for aplicado a diferentes segmentos do tubo, variações nas 
condições ambientais e nos próprios segmentos resultarão em uma corrosão maior em al- 
guns segmentos do que em outros. Os métodos de análise estatística podem ser usados 
nos dados de um experimento como esse para decidir se a quantidade média de corrosão 
excede um limite superior especificado de algum tipo ou para prever a quantidade de cor- 
rosão que ocorrerá num único tubo. 

Como alternativa, suponha que o engenheiro tenha desenvolvido tal revestimento 
acreditando que será superior àquele usado no momento. Um experimento comparativo 
pode ser efetuado para investigar essa questão, aplicando-se o revestimento atual a al- 
guns segmentos do tubo e o novo a outros. Isso deve ser feito com cuidado, para que 
não surja uma conclusão errada. Por exemplo: talvez a quantidade média de corrosão seja 
idêntica para os dois revestimentos. Entretanto, o novo revestimento pode ter sido apli- 
cado a segmentos que possuem uma capacidade superior de resistência à corrosão e sob 
condições ambientais menos severas, se comparados aos segmentos e condições do 
revestimento atual. O investigador provavelmente observaria então uma diferença cau- 
sada não pelos próprios revestimentos, mas por variações externas. A estatística oferece 
métodos não somente para análise dos resultados de experimentos depois que foram 
executados, como também sugestões de como os experimentos devem ser executados de 
forma eficiente para diminuir os efeitos das variações e ter melhores chances de produzir 
conclusões corretas. 


1.1 


Populações, amostras e processos 


Os engenheiros e cientistas estão constantemente expostos a conjuntos de fatos ou dados, tanto em suas car- 
reiras como em suas atividades diárias. A disciplina estatística fornece métodos para organizar e resumir os da- 
dos para tirar conclusões com base em informações contidas nos dados. 

Uma investigação normalmente enfocará uma coleção bem definida de objetos que constituem uma po- 
pulação de interesse. Em um estudo, a população pode consistir em todas as cápsulas de gelatina de um de- 
terminado tipo produzidas durante um período especificado. Outra investigação pode envolver a população que 
consiste em todos os indivíduos que receberam um diploma de engenharia durante o ano acadêmico mais re- 
cente. Quando as informações desejadas estiverem disponíveis para todos os objetos da população, temos o que 
é denominado censo. Restrições de tempo, dinheiro e outros recursos escassos normalmente tomam um censo 
impraticável ou inviável. Em vez disso, um subconjunto da população - uma amostra - é selecionado de uma 
forma prescrita. Dessa maneira, podemos obter uma amostra de mancais de uma determinada produção como 
base de investigação da conformidade dos mancais com as especificações do fabricante; ou podemos selecionar 
uma amostra dos formandos em engenharia do ano anterior para obter um retomo sobre a qualidade 
dos currículos. 
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Normalmente, estamos interessados apenas em certas características dos objetos de uma população: o 
número de falhas na superfície de cada invólucro, a espessura de cada parede da cápsula, o sexo de um formando 
em engenharia, a idade com que um indivíduo se formou etc. Uma característica pode ser categorizada, como 
sexo ou tipo de defeito, ou pode ter natureza numérica. No primeiro caso, o valor da característica é uma cate- 
goria (por exemplo, feminino ou solda insuficiente), enquanto, no último caso, o valor é um número (por exem- 
plo, idade = 23 anos ou diâmetro = 0,502 cm). Uma variável é qualquer característica cujo valor pode mudar 
de um objeto para outro na população. Inicialmente, devemos identificar as variáveis com letras minúsculas do 
final do nosso alfabeto. Os exemplos incluem: 

x = marca da calculadora de um estudante 

y = número de defeitos graves em um automóvel recentemente fabricado 

z = distância de frenagem de um automóvel sob condições especificadas 

Os dados resultam da observação de uma variável ou de duas ou mais variáveis simultaneamente. Um conjunto 
de dados univariado consiste em observações sobre uma única variável. Por exemplo: podemos determinar o 
tipo de transmissão, automática (A) ou manual (M), de cada um dentre 10 automóveis recentemente comprados 
em um determinado revendedor, resultando em um conjunto de dados categorizados. 

MAAAMAAMAA 

A amostra a seguir de vida útil (horas) de baterias da marca D colocadas em um determinado uso é um conjunto 
numérico de dados univariados: 

5,6 5,1 6,2 6,0 5,8 6,5 5,8 5,5 

Temos dados bivariados quando as observações são feitas em cada uma de duas variáveis. Nosso conjunto 
de dados pode consistir em um par (altura, peso) de cada jogador de basquete de um time, com a primeira ob- 
servação como (72, 168), a segunda como (75, 212) e assim por diante. Se um engenheiro determinar o valor de 
x = vida útil do componente e y = motivo de falha do componente, o conjunto de dados resultante será biva- 
riado com uma variável numérica e outra categorizada. Dados multivariados surgem quando são feitas obser- 
vações sobre mais de duas variáveis. Por exemplo: um médico pesquisador pode determinar a pressão sanguínea 
sistólica, a pressão sangüínea diastólica e o nível de colesterol de cada paciente participante de um estudo. Cada 
observação seria um trio de números, como (120, 80, 146). Em muitos conjuntos de dados multivariados, algu- 
mas variáveis são numéricas e outras são categorizadas. Dessa forma, a edição automotiva anual de Consumer 
Reports fornece valores de tais variáveis como tipo do veículo (pequeno, esportivo, compacto, médio, grande), 
consumo de combustível na cidade (milhas/galão), consumo de combustível na estrada (milhas/galão), tipo de 
tração (traseira, dianteira, nas quatro rodas) e assim por diante. 

Ramos da estatística 

Um investigador que tenha coletado dados pode simplesmente desejar resumir e descrever suas características 
importantes. Isso exige a utilização de métodos de estatística descritiva. Alguns desses métodos são gráficos 
por natureza: a construção de histogramas, boxplots e gráficos de dispersão são os exemplos principais. Outros 
métodos descritivos envolvem o cálculo de medidas numéricas, como médias, desvios padrão e coeficientes de 
correlação. A ampla disponibilidade de pacotes de softwares estatísticos facilitou bastante essas tarefas. Os com- 
putadores são muito mais eficientes que os seres humanos em cálculo e na criação de imagens (depois de terem 
recebido as instruções corretas do usuário). Isso significa que o investigador não tem de perder muito tempo com 
“trabalho braçal” e terá mais tempo para estudar os dados e extrair mensagens importantes. Neste livro serão 
apresentados resultados de vários pacotes, como M1NITAB, SAS, e S-Plus. 

Exemplo 1.1 

A tragédia que ocorreu com o ônibus espacial Challenger e seus astronautas, em 1 986, levou a diversos estudos 
para investigar os motivos da falha da missão. A atenção rapidamente se voltou ao comportamento dos anéis de 
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vedação do motor do foguete. Aqui estão os dados resultantes de observações de x = temperatura 
do anel de vedação (°F) de cada teste de acionamento ou lançamento real do motor do foguete da nave ( Presi - 
dential Commission on the Space Shuttle Challenger Accident. Vol. 1, 1986: 129-131). 
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Sem nenhuma organização, é difícil ter noção do que pode ser uma temperatura normal ou representativa, se os 
valores estão altamente concentrados em tomo de um ponto ou se estão dispersos, se há lacunas nos dados, que 
porcentagem dos dados estão na faixa dos 60 e assim por diante. A Figura 1.1 mostra o que é chamado de dia- 
grama caule e folha dos dados, assim como um histograma . Mais adiante serão discutidas a construção e a in- 
terpretação desses resumos ilustrativos; no momento, desejamos que você observe como eles começam a nos 
mostrar como os valores de temperatura são distribuídos ao longo da escala de medida. Alguns desses lança- 
mentos/acionamentos tiveram sucesso e outros resultaram em falha. No Capítulo 13, consideraremos se a tem- 
peratura teve influência na probabilidade de um lançamento bem-sucedido. 


Caule folha da temp N = 36 
Unidade da folha = 1,0 
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Figura 1.1 Um diagrama caule e folha MINITAB e histograma dos dados da temperatura 
do anel de vedação ■ 


Com uma amostra da população, um investigador freqüentemente usaria as informações da amostra para 
tirar algum tipo de conclusão (fazer uma inferência de algum tipo) sobre a população, ou seja, a amostra é um 
meio para chegar a um fim e não o fim em si. As técnicas de generalização de uma amostra para uma população 
são agrupadas no ramo da nossa disciplina denominado inferência estatística. 

Exemplo 1.2 

As investigações de resistência de materiais fornecem um campo fértil para a aplicação de métodos estatísticos. 
O artigo “Effects of Aggregates and Microfillers on the Flexural Properties of Concrete” ( Magazine of Concrete 
Research , 1997, p. 81-98) relatou um estudo de propriedades de resistência de concreto de alto desempenho obti- 
das pela utilização de superplásticos e determinados adesivos. A resistência à compressão desse concreto foi 
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investigada anteriormente, mas não se sabe muito sobre a resistência à flexão (uma medida da capacidade de re- 
sistência a falhas decorrentes de flexão). Os dados a seguir sobre resistência à flexão (em megapascal, MPa, onde 
1 Pa (pascal) = 1,45 X 10 4 psi) foram exibidos no artigo citado: 

5,9 7,2 7,3 6,3 8,1 6,8 7,0 7,6 6,8 6,5 7,0 6,3 7,9 9,0 

8,2 8,7 7,8 9,7 7,4 7,7 9,7 7,8 7,7 11,6 11,3 11,8 10,7 

Suponha que busquemos uma estimativa do valor médio da resistência à flexão de todas as vigas que podem ser 
feitas dessa forma (se considerarmos a população de todas as vigas, estaremos tentando estimar a média da popu- 
lação). Pode-se mostrar que, com alto nível de confiança, a resistência média da população está entre 7.48 MPa 
e 8,80 MPa. Isso é denominado intervalo de confiança ou estimativa por intervalo. De forma alternativa, esses 
dados podem ser usados para prever a resistência à flexão de uma única viga desse tipo. Com alto nível de con- 
fiança, a resistência de uma determinada viga excederá 7,35 MPa. O número 7,35 é denominado limite inferior 
de previsão. ■ 

Este livro enfoca principalmente os métodos de apresentação e ilustração de inferência estatística úteis ao 
trabalho científico. Os tipos mais importantes de procedimentos inferenciais (estimativa por pontos, teste de 
hipóteses e estimativa por intervalos de confiança) são apresentados nos capítulos 6-8 e usados em aplicações 
mais avançadas nos capítulos 9-16. O restante deste capítulo apresenta os métodos de estatística descritiva mais 
usados no desenvolvimento da inferência. 

Os capítulos 2-5 apresentam material da disciplina de probabilidade. Esse material, em suma, faz uma 
ponte entre as técnicas descritiva e inferencial. A proficiência em probabilidade leva à melhor compreensão de 
como os procedimentos inferenciais são desenvolvidos e usados, como as conclusões estatísticas podem ser 
traduzidas para a linguagem do dia-a-dia e interpretadas, e quando e onde podem ocorrer ciladas na aplicação 
dos métodos. A probabilidade e a estatística lidam com questões que envolvem populações e amostras, mas o 
fazem de “maneira inversa” uma em relação a outra. 

Em um problema de probabilidade, as propriedades da população, que são objeto de estudo, são assumidas 
como conhecidas (por exemplo: em uma população numérica, uma distribuição especificada dos valores da 
população pode ser assumida) e as questões relativas a uma amostra proveniente da população são propostas e 
respondidas. Em um problema de estatística, as características de uma amostra estão disponíveis ao investigador 
e essas informações permitem que ele tire conclusões sobre a população. A relação entre as duas disciplinas pode 
ser resumida da seguinte forma: a probabilidade faz suas considerações da população para a amostra (raciocínio 
dedutivo) e a inferência estatística faz considerações da amostra para a população (raciocínio indutivo). Isso é 
ilustrado na Figura 1 .2. 


Probabilidade 



inferencial 

Figura 1.2 A relação entre probabilidade e inferência estatística 


Antes de podermos entender o que uma determinada amostra pode nos dizer sobre a população, devemos 
entender a incerteza associada à tomada da amostra de uma dada população. E por isso que estudamos proba- 
bilidade antes de estatística. 

Como exemplo do contraste entre os focos da probabilidade e da inferência estatística, considere o uso de 
cintos de segurança manuais de dois pontos em carros equipados com cintos automáticos de três pontos. (O ar- 
tigo “Automobile Seat Belts: Usage Pattems in Automatic Belt Systems,” Human Factors, 1998, p. 126-135, re- 
sume os dados de utilização.) Em probabilidade, podemos assumir que 50% de todos os motoristas de carros 
equipados dessa forma em uma determinada área metropolitana usam regularmente o cinto de dois pontos (uma 
hipótese sobre a população), de forma que perguntamos: “Qual a probabilidade de que uma amostra de 1 00 mo- 
toristas inclua ao menos 70 que usam regularmente o cinto de dois pontos?” ou “Em uma amostra de tamanho 
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100. quantos motoristas podemos esperar que usem o cinto de dois pontos?” Por outro lado, em inferência 
estatística temos as informações da amostra disponíveis. Por exemplo: uma amostra de 100 motoristas de tais 
carros revelou que 65 usam o cinto de dois pontos regularmente. Podemos perguntar então: “Isso fornece 
evidência suficiente para a conclusão de que mais de 50% de todos os motoristas nessa área usam regularmente 
o cinto de dois pontos?” Nesse último cenário, tentamos usar as informações da amostra para responder a uma 
pergunta sobre a estrutura de toda a população a partir da qual a amostra foi selecionada. 

No exemplo do cinto de dois pontos, a população está bem definida e concreta: todos os motoristas de car- 
ros equipados de uma forma em uma determinada área metropolitana. No Exemplo 1.1, entretanto, está dispo- 
nível uma amostra de temperaturas de anéis de vedação de uma população que não existe realmente. Em vez 
disso, é conveniente pensarmos na população como consistindo de todas as medidas possíveis de temperatura 
que podem ser feitas em condições experimentais similares. Tal população é denominada população conceituai 
ou hipotética. Há diversas situações de problemas em que se encaixam questões na estrutura de inferência es- 
tatística pela conceitualização de uma população. 

Estudos enumerativos versus analíticos 

W. E. Deming, um influente estatístico norte-americano, força motriz na revolução de qualidade do Japão nos 
anos 50 e 60, apresentou a distinção entre estudos enumerativos e estudos analíticos. No primeiro, o interesse 
se foca em uma coleção finita, identificável e imutável de indivíduos ou objetos que formam uma população. 
Uma estrutura de amostragem, isto é, uma listagem de todos os indivíduos ou objetos a fazerem parte da 
amostra, está disponível a um investigador ou pode ser construída. Por exemplo: a estrutura pode ser constituída 
por todas as assinaturas em uma petição para qualificação de uma determinada iniciativa de voto secreto em uma 
eleição iminente; uma amostra normalmente é selecionada para apurar se o número de assinaturas válidas ex- 
cede um valor especificado. Como outro exemplo, a estrutura pode conter números de série de todos os fomos 
fabricados por uma determinada empresa durante certo período de tempo; uma amostra pode ser selecionada 
para inferir algo sobre a vida útil média dessas unidades. A utilização de métodos inferenciais a ser desenvolvida 
neste livro é razoavelmente não-controversa nesse cenário (apesar de os estatísticos ainda poderem discutir so- 
bre que métodos em particular devem ser usados). 

Um estudo analítico é definido, de modo geral, como aquele que não é de natureza enumerativa. Esses es- 
tudos são normalmente executados com o objetivo de melhorar um produto futuro por meio da ação em um 
processo de algum tipo (por exemplo: recalibragem de equipamentos ou ajuste do nível de algum insumo, como 
a quantidade de um catalisador). Freqüentemente, os dados podem ser obtidos apenas em um processo existente, 
que pode diferir do processo futuro em aspectos importantes. Dessa forma, não há uma estrutura de amostragem 
que relacione os indivíduos ou objetos de interesse. Por exemplo: uma amostra de cinco turbinas com um novo 
design pode ser fabricada e testada em caráter experimental para investigar sua eficiência. Essas cinco turbinas 
podem ser vistas como uma amostra da população conceituai de todos os protótipos que podem ser fabricados 
em condições similares, mas não necessariamente como representantes da população de unidades fabricadas 
depois que a produção for iniciada. Os métodos de utilização de informações de amostras para obtenção de con- 
clusões sobre a produção futura podem ser problemáticos. Alguém com experiência na área de projetos e en- 
genharia de turbinas (ou de qualquer outra área relevante para a disciplina) deve ser chamado para julgar se essa 
extrapolação é sensata. Uma boa exposição dessas questões está no artigo “Assumptions for Statistical Infe- 
rence” de Gerald Hahn e William Meeker (The American Statistician, 1993, p. 1-11). 

Coletando dados 

A estatística lida não somente com a organização e análise de dados depois de sua coleta, como também com o 
desenvolvimento de técnicas de coleta. Se os dados não são coletados de forma correta, um investigador pode 
não ter condições de responder às questões em consideração com um nível de confiança razoável. Um problema 
comum é que a população-alvo — a respeito da qual serão tiradas conclusões — pode ser diferente da população 
da qual se obteve a amostra. Por exemplo: publicitários podem desejar diversos tipos de informações sobre os 
hábitos televisivos de clientes potenciais. As informações mais sistemáticas desse tipo são provenientes de dis- 
positivos de monitoramento locais em um pequeno número de lares nos Estados Unidos. Já se presumiu que a 
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colocação em si desses dispositivos afeta o comportamento dos telespectadores, de forma que as características 
da amostra podem ser diferentes daquelas da população-alvo. 

Quando a coleta de dados exige a seleção de indivíduos ou objetos a partir de uma estrutura, o método mais 
simples de assegurar uma seleção representativa é tomar uma amostra aleatória simples. Trata-se de uma amostra 
em que qualquer subconjunto de tamanho especificado (como uma amostra de tamanho 100) tem a mesma chance 
de ser selecionado. Por exemplo: se a estrutura consistir em 1 .000.000 de números de série, os números 1, 2, ... 
até 1.000.000 podem ser colocados em tiras idênticas de papel. Após colocá-las em uma caixa e mexer bastante, 
elas podem ser retiradas uma a uma, até que a amostra de tamanho requerido seja obtida. De forma alternativa (e 
normalmente preferida), uma tabela de números aleatórios ou um gerador de números aleatórios pode ser usado. 

Algumas vezes, os métodos de amostragem alternativos podem ser usados para facilitar o processo de se- 
leção, para obter informações extras ou para aumentar o nível de confiança das conclusões. Um desses métodos, 
a amostragem estratificada, exige a separação das unidades da população em grupos não-passíveis de so- 
breposição e a tomada de uma amostra de cada um. Por exemplo: um fabricante de videocassetes pode desejar 
informações sobre a satisfação dos clientes com as unidades produzidas no ano anterior. Se foram fabricados e 
vendidos três modelos diferentes, pode ser selecionada uma amostra de cada um dos três modelos correspon- 
dentes, o que resultaria em informações sobre todos os modelos e asseguraria que nenhum deles teve mais ou 
menos representatividade na amostra inteira. 

Freqüentemente, uma amostra de “conveniência” é obtida pela seleção de indivíduos ou objetos sem 
aleatoriedade sistemática. Como exemplo, um grupo de tijolos pode ser empilhado de forma que seja extrema- 
mente difícil selecionar as peças centrais. Se os tijolos do topo e das laterais forem de alguma forma diferentes 
dos outros, os dados resultantes da amostra não serão representativos da população. Um investigador assumirá, 
com freqüência, que essa amostra de conveniência se aproxima de uma amostra aleatória. Nesse caso, o 
repertório de métodos inferenciais do estatístico pode ser usado, o que é, entretanto, de julgamento do profis- 
sional. A maioria dos métodos discutidos daqui em diante são baseadas em variações da amostragem aleatória 
simples, descritas no Capítulo 5. 

Os engenheiros e cientistas freqüentemente coletam dados executando algum tipo de experimento, o que 
pode envolver a decisão de como alocar diferentes tratamentos (como fertilizantes ou revestimentos para proteção 
de corrosão) às diversas unidades experimentais (lotes de terra ou segmentos de tubo). Além disso, um investi- 
gador pode variar sistematicamente os níveis ou categorias de determinados fatores (como pressão ou tipo de ma- 
terial isolante) e observar o efeito em alguma variável de resposta (como o resultado de um processo de produção). 

Exemplo 1.3 

Um artigo no New York Times (27 de janeiro de 1987) reportou que o risco de ataques cardíacos pode ser 
reduzido pela ingestão de aspirina. Essa conclusão foi baseada em um experimento planejado que envolveu um 
grupo de controle de indivíduos que tomaram um placebo com aparência de aspirina, mas reconhecidamente inó- 
cuo, e outro que tomou aspirina de acordo com um regime especificado. Os comprimidos foram atribuídos 
aleatoriamente aos grupos para evitar desvios, tomando possível a utilização de métodos probabilísticos para 
análise dos dados. Dos 1 1.034 componentes do grupo de controle, 1 89 tiveram ataques cardíacos posteriormente, 
enquanto apenas 1 04 dos 1 1 .037 indivíduos do grupo da aspirina tiveram o problema. A taxa de incidência de 
ataques cardíacos no grupo de tratamento foi cerca de metade da taxa do grupo de controle. Uma explicação pos- 
sível para esse resultado é a variação devida ao acaso: que a aspirina não tem o efeito desejado e que a diferença 
observada é uma variação normal, da mesma forma que jogar duas moedas idênticas normalmente produziria 
números diferentes de caras. Entretanto, nesse caso, os métodos inferenciais sugerem que a variação devida ao 
acaso em si não pode explicar adequadamente a magnitude da diferença observada. ■ 

Exemplo 1.4 

Um engenheiro deseja investigar os efeitos de um tipo de adesivo e de um material condutor na resistência do 
contato ao montar um IC (Circuito Integrado) em uma determinada base. Dois tipos de adesivo e dois materiais 
condutores estão sendo considerados. Duas observações são feitas para cada combinação - tipo de adesivo/ma- 
terial condutor - resultando nos dados a seguir: 
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Tipo de adesivo Material condutor Resistência observada do contato Média 


1 

1 

82, 77 

79,5 

1 

2 

75, 87 

81,0 

2 

1 

84, 80 

82,0 

2 

2 

78, 90 

84,0 


As resistências de contato médias são ilustradas na Figura 1.3. Parece que o tipo de adesivo 2 melhora a re- 
sistência do contato se comparado ao tipo 1 mais ou menos no mesmo valor, não importando o material condu- 
tor usado, com a combinação 2, 2 sendo a melhor. Os métodos inferenciais podem novamente ser usados para 
julgar se esses efeitos são reais ou simplesmente conseqüência da variância devido ao acaso. 



Figura 1.3 Resistências de contato médias no Exemplo 1.4 


Suponha, adicionalmente, que haja dois períodos de cura em consideração e também dois tipos de circuito 
integrado após o revestimento. Há, portanto, 2 • 2 • 2 • 2 = 16 combinações desses quatro fatores e nosso enge- 
nheiro não possui recursos suficientes nem mesmo para fazer uma única observação para cada uma dessas com- 
binações. No Capítulo 1 1 veremos como a seleção cuidadosa de uma fração dessas possibilidades normalmente 
fornecerá as informações desejadas. ■ 


Exercícios Seção 1.1 (1-9) 

1, Forneça uma amostra possível, de tamanho 4, de cada 
uma das populações a seguir: 

a. Todos os jornais diários publicados nos Estados 
Unidos. 

b. Todas as empresas listadas na New York Stock Ex- 
change. 

c. Todos os alunos de sua universidade ou faculdade. 

d. Todas as médias, em pontos, dos alunos de sua uni- 
versidade ou faculdade. 


2. Para cada uma das populações hipotéticas a seguir, for- 
neça uma amostra plausível de tamanho 4: 

a. Todas as distâncias que podem resultar quando uma 
bola de futebol é arremessada. 

b. O tamanho das páginas dos livros publicados nos úl- 
timos cinco anos. 

c. Todas as medidas de intensidade de terremotos (es- 
cala Richter) que podem ser registradas na Califórnia 
durante o próximo ano. 

d. Todos os possíveis produtos (em gramas) de uma de- 
terminada reação química feita em um laboratório. 


3. Considere a população que consiste em todos os video- 
cassetes de uma determinada marca e modelo, e enfoque 
se um videocassete precisa de manutenção durante o 
tempo de garantia. 

a. Formule diversas questões sobre probabilidade basea- 
das em uma amostra de 100 desses videocassetes. 

b. Qual questão sobre inferência estatística pode ser res- 
pondida ao determinar o número de videocassetes que 
precisam de serviço de garantia em uma amostra de 
tamanho 100? 

4. a. Dê três exemplos diferentes de populações concretas 

e três exemplos diferentes de populações hipotéticas, 
b. Para cada uma de suas populações hipotéticas e 
concretas, dê um exemplo de uma questão sobre 
probabilidade e um exemplo de uma questão so- 
bre inferência estatística. 

5. Diversas universidades e faculdades instituíram progra- 
mas de Instrução Suplementar (SI), em que um monitor 
se encontra regularmente com um grupo de estudantes 
matriculados em um curso para promover discussões 
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sobre o material desse curso e melhorar o domínio da 
disciplina. Suponha que os estudantes de um grande 
curso de estatística (o que mais poderia ser?) são aleato- 
riamente divididos em um grupo de controle que não 
participará do SI e um grupo de tratamento que o fará. 
No final do período, é determinada a pontuação total de 
cada estudante no curso. 

a. As pontuações do grupo de SI são uma amostra da 
população existente? Caso seja, qual é? Caso con- 
trário, qual é a população conceituai relevante? 

b. Qual você acha que é a vantagem de dividir aleatoria- 
mente os estudantes em dois grupos em vez de deixar 
cada estudante escolher o grupo do qual participará? 

c. Por que os investigadores não colocaram todos os es- 
tudantes no grupo de tratamento? Nota: O artigo 
“Supplemental Instruction: An Effective Component 
of Student Affairs Programming” (7. of College Stu- 
dent Devei , 1997, p. 577-586) discute a análise de da- 
dos de diversos programas de SI. 

6. O sistema da CSU (Califórnia State University) consiste 
em 23 campi , de San Diego State, no sul, até Humboldt 
State, perto da fronteira com Oregon. Um administrador 
da CSU deseja fazer uma inferência sobre a distância 
média entre as cidades natais de seus alunos e seus 
campi. Descreva e discuta diversos métodos de amos- 
tragem que podem ser empregados. Esse estudo seria 
enumerativo ou analítico? Explique seu raciocínio. 


7. Certa cidade é dividida naturalmente em 10 bairros. 
Como um avaliador imobiliário deve selecionar uma 
amostra de casas de uma única família que pode ser usa- 
da como base para o desenvolvimento de uma equação 
para previsão do valor avaliado a partir de características 
como idade, tamanho, número de banheiros, distância 
até a escola mais próxima e assim por diante? Esse es- 
tudo é enumerativo ou analítico? 

8. A quantidade de fluxo que passa através de uma válvula 
solenoide em um sistema de controle de poluição de um au- 
tomóvel é uma característica importante. Foi executado um 
experimento para estudar como a taxa do fluxo depende de 
três fatores: comprimento do núcleo, carga da mola e lar- 
gura da bobina. Foram escolhidos dois níveis diferentes 
(alto e baixo) de cada fator e foi feita uma única observação 
sobre o fluxo para cada combinação de níveis. 

a. O conjunto de dados resultante consistiu em quan- 
tas observações? 

b. Esse estudo é enumerativo ou analítico? Explique 
seu raciocínio. 

9. Em um famoso experimento executado em 1882, Michel- 
son e Newcomb fizeram 66 observações do tempo levado 
pela luz para percorrer a distância entre dois locais em 
Washington, D.C. Algumas das medidas (codificadas de 
certa forma) foram 3 1 , 23, 32, 36, -2, 26, 27 e 3 1 . 

a. Por que essas medidas não são idênticas? 

b. Esse estudo é enumerativo? Por quê ? 


1.2 


Métodos tabular e gráfico 
em estatística descritiva 


A estatística descritiva pode ser dividida em duas áreas gerais. Nesta seção, discutiremos a primeira dessas 
áreas, que representa um conjunto de dados usando técnicas visuais. Nas seções 1.3 e 1 .4, desenvolveremos al- 
gumas medidas numéricas simples para conjuntos de dados. Muitas técnicas visuais podem ser conhecidas: 
tabelas de frequência, folhas de contagem, histogramas, gráficos de pizza, gráficos de barras, digramas de dis- 
persão e afins. Aqui enfocamos algumas dessas técnicas, que são mais úteis e relevantes para probabilidade e 
inferência estatística. 


Notações 

Algumas notações gerais facilitarão a aplicação de nossos métodos e fórmulas a uma ampla gama de problemas 
práticos. O número de observações em uma única amostra, isto é, o tamanho da amostra, normalmente será re- 
presentado por n, de forma que n = 4 para a amostra de universidades {Stanford, Iowa State, Wyoming, 
Rochester} e também para a amostra de medidas de pH {6,3; 6,2; 5,9; 6,5). Se duas amostras estiverem sendo 
consideradas simultaneamente, m e n ou n, e n, podem ser usados para representar os números de observações. 
Portanto, se {29,7; 31,6; 30,9} e {28,7; 29,5; 29,4; 30,3} forem medidas de eficiência térmica para dois tipos de 
motor diesel, então m = 3 e n = 4. 

Dado um conjunto de dados que consiste de n observações de uma variável x, as observações indi- 
viduais serão representadas por a:,, jc,, x y jc o ,. O índice não tem nenhuma relação com a magnitude de uma 
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determinada observação. Dessa forma, jc, em geral não será a menor observação do conjunto e x n normalmente 
não será a maior. Em diversas aplicações, x f será a primeira observação coletada pelo investigador, .t, será a se- 
gunda e assim por diante. A í-ésima observação do conjunto de dados será representada por x r 

Diagramas de caule e folha 

Considere um conjunto de dados numéricos jc,, jc,, ... , x n . para o qual cada x consiste de. pelo menos, dois dígi- 
tos. Uma forma rápida de obter uma representação visual informativa do conjunto de dados é construir um dia- 
grama de caule e folha. 


Etapas de construção de um diagrama de caule e folha 

1. Selecione um ou mais dígitos de liderança para serem o caule. Os dígitos à direita desse dígito 
de liderança serão as folhas. 

2. Relacione os valores de caule possíveis em uma coluna vertical. 

3. Registre a folha de cada observação ao lado do caule correspondente. 

4. Indique as unidades dos caules e das folhas em algum lugar do diagrama. 


Se o conjunto de dados consistir em notas de provas, cada uma entre 0 e 100, a pontuação de 83 terá caule 8 e 
folha 3. Para um conjunto de dados de consumo de combustível de automóveis (milhas/galão), todos entre 8,1 e 
47,8, podemos usar as dezenas como caule, de forma que 32,6 teria uma folha de 2,6. Em geral, recomenda-se 
que o diagrama tenha entre 5 e 20 caules. 

Exemplo 1.5 

O consumo de álcool por alunos de faculdades causa grande preocupação, não apenas para os membros da co- 
munidade acadêmica, como também pelas conseqüências potenciais à saúde e à segurança da sociedade em 
geral. O artigo “Health and Behavioral Consequences of Binge Drinking in College” (7. ofthe Amer Med. As- 
soe., 1994, p. 1672-1677) relatou em um abrangente estudo de consumo excessivo de álcool em diversos campi 
nos Estados Unidos. Um episódio de bebedeira foi definido como cinco ou mais bebidas em seqiiência para os 
homens e quatro ou mais para as mulheres. A Figura 1.4 mostra um diagrama de caule e folha de 140 valores de 
x = ao percentual de estudantes de nível superior que se embriagam. (Esses valores não foram fornecidos no ar- 
tigo citado, mas nosso diagrama apresenta-se de acordo com a ilustração exibida dos dados.) 

A primeira folha na linha do caule 2 é 1, o que nos informa que 21% dos alunos de uma das faculdades da 
amostra se embriagavam. Sem a identificação dos dígitos do caule e das folhas no diagrama, não saberíamos se 
a observação do caule 2, folha 1, devia ser lida como 21%, 2,1% ou 0,21%. 


0 

1 

2 

3 

4 

5 

6 


4 

1345678889 

1 223456666777889999 Caule: dígito das dezenas 

01 12233344555666677777888899999 Folha: dígito das unidades 

1 1 1222223344445566666677788888999 
001 1 1222233455666667777888899 
01111244455666778 


Figura 1.4 Diagrama de caule e folha de percentual de alunos que se embriagam em cada uma de 140 faculdades 


Ao criar um diagrama a mão, a organização das folhas da menor para a maior em cada linha pode tomar 
muito tempo e essa organização normalmente contribui pouco ou quase nada para informações extras. Suponha 
que as observações tenham sido relacionadas em ordem alfabética por nome de escola, da seguinte forma: 


16% 33% 64% 37% 31% ... 
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Colocar esses valores no diagrama nessa ordem resultaria no caule 1 tendo 6 como sua primeira folha e o começo 
da linha do caule 3 seria 

3 | 371 . . . 

O diagrama sugere que um valor típico ou representativo está na linha do caule 4, talvez na metade da faixa 
de 40%. As observações não estão altamente concentradas em tomo desse valor típico, como estariam se todos 
os valores estivessem entre 20% e 49%. O diagrama cresce para um único pico, quando nos movemos para baixo 
e então declina: não há lacunas no diagrama. Seu formato não é perfeitamente simétrico, parece aumentar mais 
na direção das folhas inferiores, do que na direção das folhas de cima. Por último, não há observações distantes 
da parte principal dos dados (sem outliers, ou seja, pontos fora da curva), como aconteceria se um dos 
valores fosse 86% em vez de 26%. A característica mais surpreendente dos dados é que, na maior parte das fa- 
culdades, pelo menos um quarto dos alunos se embriaga. O problema do consumo excessivo de álcool nos campi 
é muito mais difundido do que muitos haviam suspeitado. ■ 

Um diagrama de caule e folha transmite informações sobre os seguintes aspectos dos dados: 

• identificação de um valor típico ou representativo; 

• extensão da dispersão ao redor do valor típico; 

• presença de lacunas nos dados; 

• extensão da simetria na distribuição de valores; 

' • número e localização dos bicos; 

• presença de valores fora da curva. 

Exemplo 1.6 

A Figura 1 .5 apresenta diagramas de caule e folha para uma amostra aleatória de comprimentos de campos de golfe 
(jardas) que foram designados pela Golf Magazine entre os mais desafiadores dos Estados Unidos. Entre a amostra 
de 40 campos, o mais curto tem 6.433 jardas de comprimento e o mais longo, 7.280. Os comprimentos parecem 
estar distribuídos de forma aproximadamente uniforme acima da faixa de valores da amostra. Observe que, aqui, 
uma escolha de caule de um único dígito (6 ou 7) ou de três dígitos (643, ... , 728) resultaria em diagramas não-in- 
formativos, no primeiro caso porque não haveria caules suficientes, no segundo, porque haveria caules demais. 


Caule: Dígitos de milhares e centenas 


64 

35 

64 

33 

70 

Folha: Dígitos de dezenas e unidades 

65 

26 

27 

06 

83 



66 

05 

94 

14 




67 

90 

70 

00 

98 

70 

45 13 

68 

90 

70 

73 

50 



69 

00 

27 

36 

04 



70 

51 

05 

11 

40 

50 

22 

71 

31 

69 

68 

05 

13 

65 

72 

80 

09 






(a) 


Caule e folha do número de jardas N = 40 
Unidades da folha = 10 


4 

64 

3367 

8 

65 

0228 

11 

66 

019 

18 

67 

0147799 

(4) 

68 

5779 

18 

69 

0023 

14 

70 

012455 

8 

71 

013666 

2 

72 

08 


(b) 


Figura 1.5 Diagramas de caule e folha de comprimentos em jardas de campos de golfe: (a) folhas de dois dígitos; 

(b) diagrama de MINITAB com folhas truncadas de um dígito , ■ 


Um diagrama de caule e folha não mostra a ordem em que as observações foram obtidas, possivelmente 
ocultando importantes informações sobre o mecanismo gerador dos dados. Por exemplo: durante um período de 
tempo determinado, a largura de um calço de certa peça feito por uma fresa tende a aumentar em relação ao 
valor-alvo, indicando um processo “fora de controle”. Um gráfico de linha com marcadores combina o quadro 
das observações ao longo do tempo com um diagrama caule e folha. 
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Exemplo 1.7 

Cada observação no diagrama de caule e folha da Figura 1 .6 é o valor de produção de cerveja dos EUA (milhões 
de barris) para um trimestre diferente durante o período de 1975-1982. O diagrama usa caules repetidos ; por 
<?x£7Tipfo: a finha 4L é para observações com uma folha “baixa” — 0, 1 , 2, 3 ou 4 — e as observações com fo- 
lhas mais altas são colocadas na linha 4H. O gráfico da série temporal à direita mostra tendência de aumento 
com o tempo e também maior produção nos segundo e terceiro trimestres de um determinado ano do que nos 
outros dois trimestres (um efeito sazonal). 


Caule: Dígito das dezenas 
Folha: Dígito das unidades 

5 

5H 

242330 

5L 

7688996 

4H 

21421414444 

4L 

9696656 

3H 



Tempo 


Figura 1.6 Um gráfico de linha com marcadores de produção de cerveja dos Estados Unidos 


Gráfico de pontos 

Um gráfico de pontos é um interessante resumo dos dados numéricos quando esse conjunto é razoavelmente pe- 
queno ou possui relativamente poucos valores distintos. Cada observação é representada por um ponto sobre o 
local correspondente em uma escala de medida horizontal. Quando um valor ocorre mais de uma vez, há um 
ponto para cada ocorrência e esses pontos são empilhados verticalmente. Como ocorre com o diagrama de caule 
e folha, um gráfico de pontos fornece informações sobre localização, dispersão, extremos e lacunas. 

Exemplo 1.8 

A Figura 1.7 mostra um gráfico de pontos para os dados de temperatura de Anel de Vedação apresentados no 
Exemplo 1.1, na seção anterior. Um valor de temperatura representativo é o que se apresenta na metade de 60 
(°F) e há grande dispersão ao redor do centro. Os dados se estendem mais na extremidade inferior do que na ex- 
tremidade superior e a menor observação, 3 1 , pode ser claramente descrita como um outlier. 


• • ••••••••• ••••• •• •• •••• •• 

| j | 1 1 | Temperatura 

30 40 50 60 70 80 

Figura 1.7 Um gráfico de pontos dos dados de temperatura do Anel de Vedação (°F) ■ 


Se o conjunto de dados discutido no Exemplo 1.8 consistisse de 50 ou 100 observações de temperatura, 
cada uma registrada em décimos de graus, seria muito mais trabalhoso construir um gráfico de pontos. Nossa 
próxima técnica é melhor adaptável a tais situações. 

Histogramas 

Alguns dados numéricos são obtidos por contagem para determinar o valor de uma variável (o número de autua- 
ções de tráfego que uma pessoa recebeu no último ano. o número de pessoas que chegam para trabalhar durante 
um determinado período), enquanto outros dados são obtidos pela tomada de medidas (peso de um indivíduo, 
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tempo de reação a determinado estímulo). A recomendação para plotagem de um histograma geralmente é dife- 
rente para esses dois casos. 


DEFINIÇÃO 


Uma variável é discreta se o seu conjunto de valores possíveis é finito ou pode ser re- 
lacionado em uma sequência infinita (em que haja um primeiro número, um segundo e 
assim por diante). Uma variável é contínua se os seus valores possíveis consistem de um 
intervalo completo na reta de numeração. 


Uma variável discreta x quase sempre é resultante de contagem e, nesse caso, 0, 1,2, 3... ou algum sub- 
conjunto desses inteiros são valores possíveis. Variáveis contínuas surgem da tomada de medidas. Por exemplo: 
se x é o pH de uma substância química, em teoria, x pode ser qualquer número entre 0 e 14: 7.0, 7.03, 7.032 e 
assim por diante. Claro que, na prática, há limitações no que diz respeito ao grau de precisão de qualquer ins- 
trumento de medida, de forma que podemos não ser capazes de determinar pH, tempo de reação, altura e con- 
centração com um número arbitrariamente grande de casas decimais. Entretanto, do ponto de vista da criação de 
modelos matemáticos para a distribuição dos dados, é útil imaginar um intervalo contínuo de valores possíveis. 

Considere os dados constituídos de observações de uma variável discreta x. A freqüência de qualquer valor 
particular de x é o número de vezes em que esse valor ocorre naquele conjunto. A freqüência relativa de um 
valor é a fração ou proporção de vezes em que o valor ocorre: 

, „ . ... , número de vezes que o valor ocorre 

frequência relativa de um valor = número de observações do conjunto de dados 

Suponha, por exemplo, que o nosso conjunto de dados consista em 200 observações de jc = o número de 
defeitos graves em um novo carro de certo tipo. Se 70 desses valores x forem 1, então 

freqüência do valor x = 1 : 70 

70 

freqüência relativa do valor x — 1 : = 0,35 

200 

A multiplicação da freqüência relativa por 100 fornece a porcentagem. No exemplo dos defeitos, 35% dos 
carros da amostra apresentaram apenas um defeito grave. As freqüências relativas, ou porcentagens, normal- 
mente interessam mais do que as freqüências em si. Teoricamente, as freqüências relativas deveriam somar 1, 
mas, na prática, a soma pode ser ligeiramente diferente por causa do arredondamento. Uma distribuição de fre- 
qüência é uma tabulação das freqüências e/ou freqüências relativas. 


Construção do histograma para dados discretos 

Primeiro, determine a freqüência e a freqüência relativa de cada valor de x. Depois, marque os va- 
lores possíveis de x em uma escala horizontal. Acima de cada valor, desenhe um retângulo cuja al- 
tura seja a freqüência relativa (ou a freqüência, como alternativa) daquele valor. 


Essa construção assegura que a área de cada retângulo seja proporcional à freqüência relativa do valor. As- 
sim, se as freqüências relativas de x = 1 e x = 5 são 0,35 e 0,07, respectivamente, a área do retângulo acima de 
1 será cinco vezes a área do retângulo acima de 5. 

Exemplo 1.9 

Quão incomum é um jogador que não atinge a bola ou a atinge uma única vez em um jogo de beisebol da liga 
principal e com que freqüência uma equipe consegue atingir a bola mais de 10, 15 ou mesmo 20 vezes? A Tabela 
1.1 é uma distribuição de freqüência do número de acertos por equipe, por partida, para todos os jogos de nove 
séries entre 1989 e 1993. 
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Tabela 1.1 Distribuição de freqüência de acertos em jogos de nove séries 


Acertos/Jogo 

Número de 
Jogos 

Freqüência 

Relativa 

Acertos/Jogo 

Número de 
Jogos 

Freqüência 

Relativa 

0 

20 

0,0010 

14 

569 

0,0294 

1 

72 

0.0037 

15 

393 

0,0203 

2 

209 

0,0108 

16 

253 

0,0131 

3 

527 

0,0272 

17 

171 

0,0088 

4 

1048 

0,0541 

18 

97 

0,0050 

5 

1457 

0,0752 

19 

53 

0,0027 

6 

1988 

0,1026 

20 

31 

0,0016 

7 

2256 

0,1164 

21 

19 

0,0010 

8 

2403 

0.1240 

22 

13 

0,0007 

9 

2256 

0,1164 

23 

5 

0,0003 

10 

1967 

0,1015 

24 

1 

0,0001 

11 

1509 

0,0779 

25 

0 

0,0000 

12 

1230 

0,0635 

26 

1 

0,0001 

13 

834 

0,0430 

27 

1 

19.383 

0,0001 

1,0005 


O histograma correspondente da Figura 1.8 tem um leve aclive para um único pico e depois tem um de- 
clive. O histograma se estende um pouco mais do lado direito (em direção aos valores maiores) do que para o 
lado esquerdo - uma inclinação ligeiramente “positiva”. 

A partir das informações tabuladas ou do histograma em si, podemos determinar o seguinte: 

freqüência freqüência freqüência 

proporção de jogos com _ re i a tj va para + relativa para + relativa para 
no máximo dois acertos * = 0 x = 1 x = 2 

= 0,0010 + 0,0037 + 0,0108 = 0,0155 


De forma similar, 

proporção de jogos com acertos entre 
5 e 10 (inclusive) 


= 0,0752 + 0,1026 + . . . + 0,1015 = 0,6361 


Isto é, cerca de 64% de todos esses jogos tiveram entre 5 e 10 (inclusive) acertos. 


Freqüência relativa 
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A construção de um histograma de dados contínuos (medidas) exige que o eixo das medidas seja subdivi- 
dido em um número aceitável de intervalos de classe ou classes, de forma que cada observação esteja contida 
completamente em uma classe. Suponha, por exemplo, que tenhamos 50 observações de x = consumo de com- 
bustível de um automóvel (milhas/galão), sendo o menor deles 27,8 e o maior, 31,4. Podemos, então, usar os 
limites de classe 27,5, 28,0, 28,5 e 31,5, conforme mostrado abaixo: 


27,5 28.0 28.5 29.0 29.5 30,0 30.5 31.0 31.5 

Uma dificuldade potencial é que, ocasionalmente, uma observação fica exatamente sobre um dos limites de 
classe, não estando necessariamente em apenas um intervalo, por exemplo, 29,0. Uma forma de lidar com esse 
problema é usar limites como 27,55, 28,05, ... , 31,55. A adição do dígito de centésimos aos limites de clas- 
se evita que as observações estejam exatamente sobre os limites resultantes. Outra abordagem é usar as classes 

27,5-<28,0, 28,0-<28,5 3 1 ,0— <3 1 ,5. Então, 29,0 estaria na classe 29,0-<29,5 em vez de na classe 28,5-< 

29,0. Em outras palavras, com essa convenção, uma observação sobre um limite é colocada no intervalo à direita 
do limite. Essa é a maneira pela qual o MINITAB constrói um histograma. 


Construção de histograma para dados contínuos: classes de larguras iguais 

Determine a freqüência e a freqüência relativa de cada classe. Marque os limites de 
classe em um eixo de medida horizontal. Acima de cada intervalo de classe, desenhe 
um retângulo cuja altura seja a freqüência relativa correspondente (ou a freqüência). 


Exemplo 1.10 

As empresas de energia necessitam de informações sobre o consumo de seus clientes para obterem previsões 
precisas da demanda. Investigadores da Wisconsin Power and Light determinaram que o consumo de energia 
(BTUs) dura um determinado período para uma amostra de 90 lares aquecidos a gás. O valor de consumo ajus- 
tado foi calculado conforme segue: 

consumo 

consumo ajustado = 

(clima, em grau dias)(área da casa) 


O resultado apresenta-se nos dados anexos (parte do conjunto de dados armazenado FURNACE.MTW 
disponível no MINITAB) que ordenamos do menor para o maior. 


2,97 

4,00 

6.80 

6,85 

7,73 

7,87 

8,61 

8.67 

9,60 

9.76 

10,28 

10,30 

11.12 

11,21 

12,31 

12,62 

13.47 

13,60 


5,20 

5,56 

6,94 

7,15 

7,93 

8,00 

8,69 

8,81 

9,82 

9,83 

10,35 

10,36 

11,29 

11,43 

12,69 

12,71 

13,96 

14,24 


5.94 

5,98 

7,16 

7,23 

8,26 

8,29 

9,07 

9.27 

9,83 

9,84 

10,40 

10,49 

11.62 

11,70 

12.91 

12,92 

14.35 

15,12 


6,35 

6,62 

7,29 

7,62 

8,37 

8,47 

9,37 

9,43 

9,96 

10.04 

10,50 

10,64 

11,70 

12,16 

13,11 

13.38 

15,24 

16,06 


6,72 

6,78 

7.62 

7.69 

8,54 

8,58 

9,52 

9,58 

10,21 

10.28 

10,95 

11,09 

12,19 

12,28 

13,42 

13,43 

16,90 

18,26 


Deixamos o MINITAB selecionar os intervalos de classe. A característica mais impressionante do his- 
tograma da Figura 1 .9 é sua semelhança com uma curva em forma de sino (e portanto simétrica), com o ponto 
de simetria próximo a 10. 
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Classe 

l-<3 

3-<5 5-<7 

7-<9 

9— < 1 1 

1 1— < 13 

1 3— < 15 

1 5— < 1 7 

1 7— < 1 9 

Freqüência 

1 

1 11 

21 

25 

17 

9 

4 

1 

Freqüência 

relativa 

0.011 

0,011 0,122 

0,233 

0,278 

0,189 

0,100 

0,044 

0,011 


Pelo histograma, 

proporção de ->* 

observações = 0,01 + 0,01 + 0,12 + 0,23 = 0,37 (valor exato = — — = 0,378) 
inferior a 9 90 



1 3 5 7 9 11 13 15 17 19 

Figura 1 .9 Histograma dos dados do consumo de energia do Exemplo i . 1 0 


A freqüência relativa da classe 9-< 1 1 é cerca de 0,27, de forma que estimamos que metade desse valor, ou 
0,135, esteja entre 9 e 10. Consequentemente, 

mfenorílO 6 ° bserVaÇÕes - 0,37 + 0, 1 35 = 0,505 (pouco mais de 50%) 

O valor exato dessa proporção é 47/90 = 0,522. ■ 

Não há regras rápidas e absolutas sobre o número de classes ou a escolha das classes em si. Entre 5 e 20 
classes serão satisfatórias para a maior parte dos conjuntos de dados. Normalmente, quanto maior o número de 
observações em um conjunto de dados, mais classes devem ser usadas. Uma regra prática razoável é 

número de classes » V número de observações 

Classes de mesma largura podem não ser uma boa escolha se o conjunto de dados “se estender” para um 
lado ou para o outro. A Figura 1.10 exibe um gráfico de pontos desse conjunto de dados. Usar um número pe- 
queno* de classes de mesma largura resulta em quase todas as observações estarem em apenas uma ou duas 
classes. Se for usado um grande número de classes de mesma largura for usado, muitas classes terão freqüência 
zero. Uma opção melhor é usar alguns intervalos mais amplos próximos às observações dos extremos e interva- 
los mais estreitos na região de alta concentração. 
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Construindo um histograma para dados contínuos: 
classes de larguras diferentes 

Após determinar as freqüências e as freqüências relativas, calcule a altura de cada 
retângulo, usando a fórmula 

freqüência relativa da classe 

altura do retângulo = 

largura da classe 

As alturas resultantes dos retângulos normalmente são denominadas densidades e a es- 
cala vertical é a escala de densidade. Essa recomendação também funcionará quando 
as larguras das classes forem iguais. 


<■' I I H H I H I H-H-H- i M - | I -I 

<» — I 1 1 1 t — h f- 

«’ 1 — h-H — I- ■ H-H-H- l I - I ■ I 


Figura 1.10 Seleção de intervalos de classe para pontos "estendidos": (a) muitos 
intervalos estreitos de mesma largura: (b) poucos intervalos mais amplos: (c) intervalos 
de larguras diferentes 


Exemplo 1.11 

A corrosão das barras de aço da armação é um problema sério em estruturas de concreto localizadas em ambien- 
tes afetados por condições climáticas extremas. Por esse motivo, os pesquisadores têm investigado a utilização 
de barras de reforço feitas de material composto. Um estudo foi executado para desenvolver diretrizes sobre a 
aderência de barras plásticas reforçadas com fibra de vidro ao concreto (“Design Recommendations for Bond of 
GFRP Rebars to Concrete,” J. ofStructural Engr . , 1996, p. 247-254). Considere as 48 observações da resistên- 
cia da aderência medida: 


11,5 

12,1 

9,9 

9,3 

7,8 

6,2 

6,6 

7,0 

13,4 

17,1 

9,3 

5,6 

5.7 

5.4 

5,2 

5,1 

4,9 

10,7 

15,2 

8.5 

4,2 

4,0 

3,9 

3,8 

3,6 

3,4 

20,6 

25,5 

13,8 

12,6 

13,1 

8,9 

8,2 

10,7 

14,2 

7,6i 

5,2 

5,5 

5,1 

5,0 

5.2 

4,8 

4,1 

3,8 

3,7 

3,6 

3,6 

3,6 


Classe 

2-<4 

4-<6 

6-<8 

8— <12 

12-<20 

20-<30 

Freqüência 

9 

15 

5 

9 

8 

2 

Freqüência 

relativa 

0,1875 

0,3125 

0,1042 

0,1875 

0,1667 

0,0417 

Densidade 

0,094 

0,156 

0,052 

0,047 

0,021 

0.004 


O histograma resultante é exibido na Figura 1 . 1 1 . A cauda direita ou superior se estende muito além da es- 
querda ou inferior - um desvio substancial da simetria. 
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Resistência 


Figura 1.11 Um histograma de densidade em MINITAB dos dados de 
resistência à aderência do Exemplo 1.11 ■ 


Quando as larguras de classe são diferentes, deixar de usar uma escala de densidade gera um gráfico com 
áreas distorcidas. Para classes de larguras iguais, o divisor é o mesmo em cada cálculo de densidade e o cálculo 
adicional é simplesmente uma nova escala do eixo vertical (ou seja, os histogramas que usam freqüência rela- 
tiva e os que usam densidade terão exatamente a mesma aparência). Um histograma de densidade possui uma 
propriedade interessante. Ao multiplicar os dois lados da fórmula pela largura da classe, teremos 

freqüência relativa = (largura da classe)(densidade) = (largura do retângulo)(altura do retângulo) 

= área do retângulo 

Isto é, a área de cada retângulo é a freqüência relativa da classe correspondente. Além disso, como a soma 
das freqüências relativas deve ser 1,0 (exceto por arredondamento), a área total de todos os retângulos em um 
histograma de densidade é 1. Sempre é possível desenhar um histograma de forma que a área seja igual à fre- 
qüência relativa (isso também é verdade para um histograma de dados discretos). É só usar a escala de densi- 
dade. Essa propriedade terá um papel importante na criação de modelos de distribuições no Capítulo 4. 

Formatos de histogramas 

Os histogramas podem ter diversos formatos. Um histograma unimodal é aquele que possui um aclive para um 
único pico e depois um declive. Um histograma bimodal possui dois picos diferentes. A bimodalidade pode 
ocorrer quando o conjunto de dados consistir em observações sobre dois tipos bastante diferentes de indivíduos 
ou objetos. Por exemplo: considere um grande conjunto de dados formado por tempos de viagem de automóveis 
entre San Luis Obispo, Califórnia, e Monterey, Califórnia (excluindo tempo de parada para apreciar a vista, 
comer etc.). Esse histograma mostraria dois picos: um para os carros que tomaram a rota do interior (cerca de 
2,5 horas) e outro para os carros que foram pelo litoral (3,5-4 horas). A bimodalidade, entretanto, não acontece 
automaticamente nessas situações. A bimodalidade ocorrerá no histograma de dados combinados somente se os 
dois histogramas separados estiverem “distantes” em relação às suas dispersões. Assim, um grande conjunto de 
dados consistindo em alturas de alunos de faculdades não deve resultar em um histograma bimodal porque a al- 
tura típica dos homens, cerca de 69 polegadas, não está suficientemente distante da altura típica das mulheres, 
cerca de 64-65 polegadas. Um histograma com mais de dois picos é denominado multimodal. Claro que o 
número de picos pode depender da escolha dos intervalos de classe, particularmente com um pequeno número 
de observações. Quanto maior o número de classes, maior é a probabilidade de a bimodalidade ou de a multi- 
modalidade se manifestar. 

Um histograma é simétrico se a metade esquerda for uma imagem refletida da metade direita. Um histograma 
unimodal tem inclinação positiva se a cauda direita ou superior for estendida em comparação à cauda esquerda ou 
inferior e inclinação negativa desviar-se para a esquerda. A Figura 1.12 exibe histogramas “ajustados”, obtidos 
pela sobreposição de uma curva ajustada sobre os retângulos, que ilustram as diversas possibilidades. 
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Figura 1.12 Histogramas ajustados: (a) unimodal simétrico; (b) bimodal; (c) desvio positivo; (d) 
desvio negativo 


Dados qualitativos 

Tanto uma distribuição de frequência como um histograma podem ser construídos quando o conjunto de dados 
for de natureza qualitativa (categorizada). Em alguns casos, haverá uma organização natural das classes, por 
exemplo: calouros, segundanistas, terceiranistas, formandos e graduados, enquanto em outros casos a organiza- 
ção será arbitrária, por exemplo: católicos, judeus, protestantes e assim por diante. Com esses dados categori- 
zados, os intervalos sobre os quais os retângulos serão construídos devem ter a mesma largura. 

Exemplo 1.12 

Cada membro de uma amostra de 1 20 indivíduos proprietários de motocicletas foi indagado sobre a marca de 
sua moto. A distribuição de freqüência dos dados resultantes é fornecida na Tabela 1.2 e o histograma é exibido 
na Figura 1.13. 

Tabela 1.2 Distribuição de freqüência dos dados de motocicletas 

Fabricante Freqüência Freqüência Relativa 


1 . 

2 . 

3. 

4. 

5. 

6 . 


Honda 

41 

0,34 

Yamaha 

27 

0,23 

Kawasaki 

20 

0,17 

Harley-Davidson 

18 

0,15 

BMW 

3 

0,03 

Outro 

11 

0,09 


120 

1,01 


0.34 



Figura 1.13 Histograma dos dados de motocicletas ■ 


Dados Multivariados 

As técnicas apresentadas até agora referem-se exclusivamente a situações em que cada observação de um conjunto 
de dados é um único número ou uma única categoria. Os dados, entretanto, frequentemente são de natureza multi- 
variada. Isto é, se obtivermos uma amostra de indivíduos ou objetos e em cada um tivermos duas ou mais medidas, 
cada “observação” consistirá em diversas medidas de um indivíduo ou objeto. A amostra é bivariada se cada obser- 
vação consistir em duas medidas ou respostas, de forma que o conjunto de dados possa ser representado como 
(*,, y,), .... (jt n , y n ). Por exemplo: x pode se referir ao tamanho do motor e y ao seu deslocamento; ou x pode se referir 
à marca da calculadora de um formando e y à sua formação acadêmica. Nos capítulos 11-14, analisaremos con- 
juntos de dados multivariados desse tipo; assim, adiaremos uma discussão mais detalhada até lá. 
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Exercícios Seção 1.2 (10-32) 

10 . Considere os dados de resistência de vigas fornecidos 
no Exemplo 1 .2. 

a. Construa um diagrama de caule e folha dos dados. O 
que parece ser um valor de resistência representa- 
tivo? As observações parecem estar concentradas ao 
redor do valor representativo ou dispersas? 

b. O diagrama parece razoavelmente simétrico ao redor 
de um valor representativo ou seu formato pode ser 
descrito de outra forma? 

c. Parece haver valores aberrantes de resistência? 

d. Que proporção de observações de resistência dessa 
amostra excedem 10 MPa? 

11 . Cada pontuação do conjunto de notas de um exame a 
seguir está nas dezenas 60, 70, 80 ou 90. Um diagrama 
de caule e folha com apenas os quatro caules 6, 7, 8 e 9 
não forneceria uma descrição muito detalhada da dis- 
tribuição das pontuações. Nessas situações, é desejável 
usarmos caules repetidos. Aqui podemos repetir o caule 
6 duas vezes, usando 6L para pontuações na parte infe- 
rior da dezena dos 60 (folhas 0, 1, 2, 3 e 4) e 6H para as 
pontuações na parte superior da dezena dos 60 (folhas 
5, 6, 7, 8 e 9). De forma similar, os outros caules podem 
ser repetidos duas vezes para obtermos um diagrama 
consistindo em oito linhas. Construa esse diagrama pa- 
ra as pontuações fornecidas. Que característica dos dados 
é realçada por ele? 

74 89 80 93 64 67 72 70 66 85 89 81 81 

71 74 82 85 63 72 81 81 95 84 81 80 70 

69 66 60 83 85 98 84 68 90 82 69 72 87 

88 

12 . Os dados anexos de densidade para diversos tipos de 

madeira usados em construção foram relatados no ar- 
tigo “Bolted Connection Design Values Based on Euro- 
pean Yield Model” (J. of Structural Engr, 1993, 

p. 2169-2186): 

0,31 0,35 0,36 0,36 0,37 0,38 0,40 0,40 0,40 

0,41 0,41 0,42 0,42 0,42 0,42 0,42 0,43 0,44 

0,45 0,46 0,46 0,47 0,48 0,48 0,48 0,51 0,54 

0,54 0,55 0,58 0,62 0,66 0,66 0,67 0,68 0,75 

Construa um diagrama de caule e folha usando caules 
repetidos (veja o exercício anterior) e comente suas ca- 
racterísticas interessantes. 

13 . As propriedades mecânicas permissíveis para projetos 
estruturais de veículos aeroespaciais metálicos exigem 
um método aprovado para análise estatística de dados 
de testes empíricos. O artigo “Establishing Mechanical 
Property Allowables for Metals” (7. of Testing and 
Evaluation, 1998, p. 293-299) usou os dados sobre re- 
sistência à tração (ksi) como base para definir as difi- 
culdades de desenvolvimento do método. 


122,2 

124,2 

124,3 

125,6 

126.3 

126,5 

126,5 

127,2 

127,3 

127,5 

127,9 

128.6 

128,8 

129,0 

129.2 

129.4 

129,6 

130.2 

130,4 

130.8 

131,3 

131,4 

131.4 

131.5 

131.6 

131,6 

131.8 

131,8 

132,3 

132,4 

132,4 

132.5 

132,5 

132,5 

132,5 

132.6 

132,7 

132,9 

133.0 

133,1 

133,1 

133.1 

133,1 

133,2 

133,2 

133,2 

133,3 

133,3 

133,5 

133,5 

133,5 

133,8 

133,9 

134.0 

1 34,0 

134,0 

134,0 

134,1 

134,2 

134,3 

134.4 

134,4 

134,6 

134,7 

134.7 

134.7 

134,8 

134.8 

134,8 

134,9 

134,9 

135,2 

135,2 

135,2 

135,3 

135,3 

135,4 

135.5 

135,5 

135,6 

135,6 

135,7 

135.8 

135,8 

135,8 

135.8 

135.8 

135.9 

135,9 

135,9 

135,9 

136.0 

136,0 

136,1 

136,2 

136,2 

136,3 

136,4 

136.4 

136,6 

136.8 

136,9 

136,9 

137,0 

137,1 

137,2 

137,6 

137,6 

137,8 

137.8 

137,8 

137,9 

137,9 

138,2 

138,2 

138,3 

138,3 

138,4 

138,4 

138.4 

138,5 

138,5 

138.6 

138,7 

138,7 

139,0 

139,1 

139,5 

139.6 

139,8 

139.8 

140.0 

140.0 

140,7 

140.7 

140,9 

140.9 

141,2 

141,4 

141.5 

141,6 

142,9 

143,4 

143,5 

143,6 

143.8 

143,8 

143,9 

144.1 

144,5 

144,5 

147,7 

147,7 

a. 

Construa um diagrama de caule 

e folha dos 

dados 


excluindo (truncando) inicialmente os dígitos deci- 
mais e depois repetindo cada caule cinco vezes (uma 
vez para as folhas 1 e 2, uma segunda vez para as 
folhas 3 e 4 etc.). Por que é relativamente fácil iden- 
tificar um valor de resistência representativo? 
b. Construa um histograma usando classes de mesma 
largura em que a primeira classe possua um limite 
inferior a 122 e um limite superior a 124. Comente, 
então, características interessantes do histograma. 

14 . O conjunto de dados a seguir consiste de observações 
da vazão de chuveiros (L/min) de uma amostra de n = 
129 lares em Perth, Austrália (“An Application of Bayes 
Methodology to the Analysis of Diary Records in a Wa- 
ter Use Study”, J. Amer. Stat. Assoe., 1987, p. 705-711 ): 


4,6 

12,3 

7,1 

7,0 

4,0 

9,2 

6,7 

6,9 

11,5 

5.1 

11,2 

10,5 

14,3 

8,0 

8.8 

6.4 

5,1 

5,6 

9,6 

7,5 

7.5 

6,2 

5,8 

2,3 

3,4 

10.4 

9,8 

6.6 

3,7 

6.4 

8,3 

6.5 

7,6 

9,3 

9,2 

7,3 

5.0 

6,3 

13,8 

6.2 

5,4 

4.8 

7,5 

6.0 

6.9 

10,8 

7,5 

6,6 

5,0 

3,3 

7,6 

3,9 

11,9 

2,2 

15,0 

7,2 

6,1 

15,3 

18,9 

7.2 

5.4 

5,5 

4,3 

9,0 

12.7 

11,3 

7.4 

5.0 

3,5 

8,2 

8.4 

7,3 

10,3 

11,9 

6.0 

5.6 

9,5 

9.3 

10.4 

9.7 

5,1 

6,7 

10,2 

6,2 

8.4 

7,0 

4,8 

5.6 

10.5 

14,6 

10,8 

15.5 

7.5 

6,4 

3,4 

5.5 

6.6 

5.9 

15.0 

9,6 

7.8 

7,0 

6,9 

4,1 

3.6 

11.9 

3.7 

5.7 

6.8 

11,3 

9.3 

9,6 

10.4 

9,3 

6,9 

9,8 

9.1 

10.6 

4.5 

6.2 

8.3 

3,2 

4,9 

5.0 

6.0 

8.2 

6.3 

3.8 

6.0 



a. Construa um diagrama de caule e folha dos dados. 

b. Qual taxa é considerada vazão típica ou represen- 
tativa? 

c. O diagrama parece ser concentrado ou disperso? 
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d. A distribuição dos valores parece razoavelmente si- 
métrica? Em caso negativo, como você descreveria o 
desvio da simetria? 

e. Você descreveria alguma observação como distante do 
resto dos dados (um outlier )? 

15. Um artigo da Consumer Reports sobre pasta de amen- 
doim (setembro de 1990) relatou as seguintes pontua- 
ções para diversas marcas: 

Cremosa 56 44 62 36 39 53 50 65 45 40 

56 68 41 30 40 50 56 30 22 

Crocante 62 53 75 42 47 40 34 62 52 

50 34 42 36 75 80 47 56 62 


Construa um diagrama de caule e folha comparativo, 
relacionando caules na parte central da página e, então, 
exibindo as folhas de cremosa à direita e as de crocante 
à esquerda. Descreva semelhanças e diferenças para os 
dois tipos. 

16. O artigo citado no Exemplo 1.2 também fornece as in- 
formações de resistência de corpos de prova a seguir: 

6,1 5,8 7,8 7,1 7,2 9,2 6,6 8,3 7,0 8,3 

7,8 8,1 7,4 8,5 8,9 9,8 9,7 14,1 12,6 11,2 


j 


a. Construa um diagrama de caule e folha comparativo 
(veja o exercício anterior) dos dados de vigas e ci- 
lindros e, então, responda às questões nas partes (b)- 
(d) do Exercício 10 para as observações sobre os 
corpos de prova. 

b. De que formas os dois lados do diagrama são simi- 
lares? Há diferenças óbvias entre as observações so- 
bre vigas e corpos de prova? 

c. Construa um gráfico de pontos com os dados dos 
corpos de prova. 


17. Os transdutores de temperatura de um determinado tipo 
são enviados em lotes de 50. Uma amostra de 60 lotes 
foi selecionada e o número de transdutores fora das es- 
pecificações em cada lote foi determinado, resultando 
nos dados a seguir: 


21240132053 31 32 47023 
04213113412322845131 
50232106421 6033 36123 


a. Determine as freqüências e frequências relativas dos 
valores observados de x = número de transdutores 
fora das especificações em um lote. 

b. Que proporção de lotes na amostra possui no má- 
ximo cinco transdutores fora das especificações? 
Que proporção tem menos de cinco? Que pro- 
porção possui no mínimo cinco unidades fora das 
especificações? 

c. Desenhe um histograma dos dados, usando a 
freqüência relativa na escala vertical e comente 
suas características. 

18. Em um estudo de produtividade literária (“Lotka's 
Test,” Collection Mgmt., 1982, p. 1 1 1-1 18), um grande 


número de autores foi classificado de acordo com o nú- 
mero de artigos que tinham publicado durante certo 
período. Os resultados foram apresentados na dis- 
tribuição de freqüência a seguir: 


Número de 

artigos 

Freqüência 

Número de 

artigos 

Freqüência 


1 2 
784 204 


9 10 11 

6 7 6 


3 4 5 

127 50 33 


12 13 14 
7 4 4 


6 7 8 

28 19 19 

15 16 17 

5 3 3 


a. Construa um histograma correspondente a essa dis- 
tribuição de freqüência. Qual é a característica mais 
interessante do formato da distribuição? 

b. Que proporção desses autores publicou no mínimo 
cinco artigos? No mínimo 10 artigos? Mais de 10 
artigos? 

c. Suponha que os cinco que publicaram 15 artigos, os 
três que publicaram 16 e os três que publicaram 17 
tenham sido agrupados em uma única categoria exi- 
bida como “>15.” Você pode construir um his- 
tograma? Explique. 

d. Suponha que, em vez dos valores 15, 16 e 17 rela- 
cionados separadamente, eles tenham sido combina- 
dos em uma categoria 15-17 com freqüência 11. 
Você pode construir um histograma? Explique. 

19. O número de partículas de contaminação de uma 
pastilha de silício antes de certo processo de limpeza 
foi determinado para cada pastilha em uma amostra de 
tamanho 100, resultando nas freqüências a seguir: 


Número de 

partículas 

0 

1 

2 

3 

4 

5 

6 

Freqüência 

1 

2 

3 

12 

11 

15 

18 

Número de 

partículas 

8 

9 

10 

11 

12 

13 

14 

Freqüência 

12 

4 

5 

3 

1 

2 

1 


7 

10 


a. Que proporção das pastilhas da amostra tinha ao 
menos uma partícula? Ao menos cinco partículas? 

b. Que proporção das pastilhas da amostra tinha entre 
cinco e 10 (inclusive) partículas? Estritamente en- 
tre cinco e 10 partículas? 

c. Desenhe um histograma usando a freqüência rela- 
tiva no eixo vertical. Como você descreveria o for- 
mato do histograma? 


20. O artigo “Determination of Most Representative Subdi- 
vision” (7. of Energy Engn, 1993, p. 43-55) forneceu 
dados sobre diversas características de subdivisões que 
podiam ser usadas na decisão de fornecimento de ener- 
gia via linhas subterrâneas ou aéreas. Seguem os va- 
lores da variável x = comprimento total das ruas 
dentro de uma subdivisão: 
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1280 

5320 

4390 

2100 

1240 

3060 

4770 

1050 

360 

3330 

3380 

340 

1000 

960 

1320 

530 

3350 

540 

3870 

1250 

2400 

960 

1120 

2120 

450 

2250 

2320 

2400 

3150 

5700 

5220 

500 

1850 

2460 

5850 

2700 

2730 

1670 

100 

5770 

3150 

1890 

510 

240 

396 

1419 

2109 




a. Construa um diagrama de caule e folha, usando o 
dígito de milhares como caule e o de centenas como 
folha, e comente suas características. 

b. Construa um histograma, usando limites de classe de 
0, 1000, 2000, 3000, 4000, 5000 e 6000. Que pro- 
porção de subdivisões possui comprimento total infe- 
rior a 2000? Entre 2000 e 4000? Como você des- 
creveria o formato do histograma? 

21 . O artigo citado no Exercício 20 também forneceu os 
seguintes valores das variáveis y = números de culs-de- 
sac e z - número de interseções: 

y 1010020111210011011 
z l 8611 53 004400 121 404 

y \ 100011 201221 1021 10 
z 0 3 0 1 1 0 1 324660118335 

y 1 5 0 3 0 1 1 0 0 

z 0 5 2 3 1 0003 

a. Construa um histograma dos dados de y. Que pro- 
porção dessas subdivisões não possuíam culs-de- 
sacl Ao menos um cul-de-sacl 

b. Construa um histograma para os dados z. Que pro- 
porção dessas subdivisões têm no máximo cinco in- 
terseções? Menos de cinco interseções? 


22 . Como varia a velocidade de um corredor no curso de 
uma maratona (uma distância de 42,195 km)? Con- 
sidere a determinação do tempo de corrida dos cinco 
primeiros quilômetros e o tempo de corrida entre os 
pontos dos kms 35 e 40; subtraia o primeiro tempo do 
último. Um valor positivo dessa diferença corresponde 
a um corredor que diminui seu ritmo no final da corri- 
da. O histograma a seguir se baseia nos tempos de 
corredores que participaram de diversas maratonas 
diferentes no Japão (“Factors Affecting Runners’ Mara- 
thon Performance”, Chance , Fali, 1993, p. 24-30). 

Que características são interessantes nesse histograma? 
Qual é um valor típico da diferença ? Grosso modo , que 
proporção dos maratonistas correu a última etapa mais 
rápido que a primeira? 

23 . Em um estudo de quebras de urdidura durante a tece- 
lagem de tecidos ( Technometrics , 1982, p. 63), 100 
amostras de fios foram testadas. O número de ciclos de 
esforço para quebra foi determinado para cada amostra 
de fio, resultando nos dados a seguir: 


86 

146 

251 

653 

98 

249 

400 

292 

131 

169 

175 

176 

76 

264 

15 

364 

195 

262 

88 

264 

157 

220 

42 

321 

180 

198 

38 

20 

61 

121 

282 

224 

149 

180 

325 

250 

196 

90 

229 

166 

38 

337 

65 

151 

341 

40 

40 

135 

597 

246 

211 

180 

93 

315 

353 

571 

124 

279 

81 

186 

497 

182 

423 

185 

229 

400 

338 

290 

398 

71 

246 

185 

188 

568 

55 

55 

61 

244 

20 

284 

393 

396 

203 

829 

239 

236 

286 

194 

277 

143 

198 

264 

105 

203 

124 

137 

135 

350 

193 

188 


a. Construa um histograma de freqüência relativa com 
base nos intervalos de classe 0-<100, 100-<200, 
... e comente as características do histograma. 


Histograma do Exercício 22 


Freqüência 



Diferença 
de tempo 
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b. Construa um histograma com base nos seguintes in- 
tervalos de classe: 0-<50, 50-C100, 100— <150, 
150-<200, 200-000, 300-<400, 400-<500, 
500-<600 e 600-<900. 

c. Se as especificações de tecelagem exigem um es- 
forço de quebra de ao menos 100 ciclos, que pro- 
porção das amostras de fio dessa amostra deve ser 
considerada satisfatória? 

24. O conjunto de dados anexo consiste em observações da 
resistência de corte (lb) de soldas de ponto ultrassónicas 
feitas sobre um determinado tipo de chapa de Alclad. 
Construa um histograma de freqüência relativa com 
base em 10 classes de mesma largura com limites 4000, 

4200 [O histograma coincide com o mostrado em 

“Comparison of Properties of Joints Prepared by Ultra- 
sonic Welding and Other Means” (/. of Aircraft, 1983, 
p. 552-556).] Comente as características. 


5434 

4948 

4521 

4570 

4990 

5702 

5241 

5112 

5015 

4659 

4806 

4637 

5670 

4381 

4820 

5043 

4886 

4599 

5288 

5299 

4848 

5378 

5260 

5055 

5828 

5218 

4859 

4780 

5027 

5008 

4609 

4772 

5133 

5095 

4618 

4848 

5089 

5518 

5333 

5164 

5342 

5069 

4755 

4925 

5001 

4803 

4951 

5679 

5256 

5207 

5621 

4918 

5138 

4786 

4500 

5461 

5049 

4974 

4592 

4173 

5296 

4965 

5170 

4740 

5173 

4568 

5653 

5078 

4900 

4968 

5248 

5245 

4723 

5275 

5419 

5205 

4452 

5227 

5555 

5388 

5498 

4681 

5076 

4774 

4931 

4493 

5309 

5582 

4308 

4823 

4417 

5364 

5640 

5069 

5188 

5764 

5273 

5042 

5189 

4986 







25. A transformação de valores de dados por meio de uma 
função matemática, como Vjc ou 1/jc, normalmente re- 
sulta em um conjunto de números com “melhores” pro- 
priedades estatísticas do que os dados originais. Em 
particular, é possível encontrar uma função para a qual 
o histograma dos valores transformados seja mais 
simétrico (ou, melhor ainda, mais próximo de uma 
curva normal) do que os dados originais. Como exem- 
plo, o artigo ‘Time Lapse Cinematographic Analysis of 
BerylliumLung Fibroblast Interactions” ( Environ . Re- 
search, 1983, p. 34-43) relatou os resultados de experi- 
mentos projetados para estudar o comportamento de al- 
gumas células que foram expostas ao berílio. Uma 
característica importante de tal célula individual é seu 
tempo de interdivisão (IDT). Os IDTs foram determi- 
nados para um grande número de células em condições 
de exposição (tratamento) e não-exposição (controle). 
Os autores do artigo usaram uma transformação loga- 
rítmica, isto é, valor transformado = log (valor origi- 
nal). Considere os seguintes dados representativos 
de IDT: 


IDT 

log 10 (IDT) 

IDT 

log 10 (IDT) 

IDT 

log l 0 (IDT) 

28,1 

1,45 

60,1 

1,78 

21,0 

1,32 

31,2 

1,49 

23,7 

1,37 

22,3 

1,35 

13,7 

1,14 

18,6 

1,27 

15,5 

U9 

46,0 

1,66 

21,4 

1,33 

36,3 

1,56 

25,8 

1,41 

26,6 

1,42 

19,1 

1,28 

16,8 

1,23 

26,2 

1,42 

38,4 

1,58 

34,8 

1,54 

32,0 

1,51 

72,8 

1,86 

62,3 

1,79 

43,5 

1,64 

48,9 

1,69 

28,0 

1,45 

17,4 

1,24 

21,4 

1,33 

17,9 

1,25 

38,8 

1,59 

20,7 

1,32 

19.5 

1,29 

30,6 

1,49 

57,3 

1,76 

21.1 

1,32 

55,6 

1,75 

40,9 

1,61 

31,9 

1,50 

25,5 

1,41 



28,9 

1,46 

52,1 

1,72 




Use os intervalos de classes 10-<20, 20-<30.... para 
construir um histograma dos dados originais. Use os in- 
tervalos 1,1— <1,2, 1,2— < 1 ,3, ... para fazer o mesmo 
para os dados transformados. Qual é o efeito da trans- 
formação? 

26. O índice de céu claro foi determinado para o céu de 
Bagdá, compreendendo cada um dos 365 dias de um 
dado ano (“Contribution to the Study of the Solar Ra- 
diation Climate of the Baghdad Environment”, Solar 
Energy , 1990, p. 7-12). A tabela a seguir fornece os 
resultados. 


Classe 

Freqüência 

0,15-<0,25 

8 

0,25 -<0.35 

14 

0,35 -<0,45 

28 

0,45 -<0,50 

24 

0,50-<0,55 

39 

0,55 -<0,60 

51 

0,60-<0,65 

106 

0,65 -<0,70 

84 

0,70-<0,75 

11 


a. Determine as freqüências relativas e desenhe o his- 
tograma correspondente. 

b. Dias nublados são aqueles com o índice de céu 
limpo inferior a 0,35. Em que porcentagem dos dias 
o céu esteve nublado ? 

c. Dias de céu claro são aqueles para os quais o índice 
é no mínimo 0,65. Em que porcentagem dos dias o 
céu esteve limpo? 

27. O artigo “Study on the Life Distribution of Microdrills” 
(J. ofEngr Manufacture, 2002: 301-305) relatou as ob- 
servações a seguir, relacionadas em ordem crescente, da 
vida útil das brocas (número de furos que uma broca faz 
antes de quebrar), quando os furos são feitos em uma 
determinada liga de bronze. 
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11 

14 

20 

23 

31 

36 

39 

44 

47 

50 

O 

O 

N 

J 

C 

F 

B 

B 

F 

O 

J 

o 

o 

M 

59 

61 

65 

67 

68 

71 

74 

76 

78 

79 

O 

F 

F 

O 

O 

N 

O 

N 

J 

F 

J 

B 

o 

C 

81 

84 

85 

89 

91 

93 

96 

99 

101 

104 

J 

O 

J 

J 

F 

N 

O 

B 

M 

O 

J 

M 

o 

B 

105 

105 

112 

118 

123 

136 

139 

141 

148 

158 

O 

F 

J 

O 

O 

B 

N 

C 

O 

O 

O 

M 

B 

F 

161 

168 

184 

206 

248 

263 

289 

322 

388 

513 

J 

O 

F 

N 












a. Por que uma distribuição de freqüência não pode ter 
por base os intervalos de classe 0-50, 50-100, 
100-150 e assim por diante? 

b. Construa uma distribuição de freqüência e um his- 
tograma dos dados usando limites de classes 0, 50, 
100, ... e então faça comentários sobre as caracterís- 
ticas interessantes. 

c. Construa uma distribuição de freqüência e um his- 
tograma dos logaritmos naturais relacionados às 
observações de vida útil e comente as característi- 
cas interessantes. 

d. Que proporção das observações de vida útil dessa 
amostra é inferior a 1 00? Que proporção das obser- 
vações é igual ou maior que 200? 

28. Construa um gráfico de pontos para a série de dados 
anexa. Os dados são mensais e foram obtidos durante o 
período de 1985-1989. Cada valor é a radiação solar 
média na faixa 385-530 nm como porcentagem da 
radiação total (“Global Energy in the Different Spectral 
Bands at Dhahran, Saudi Arabia,” J. Solar Energy 
Engr. t 1991, p. 290-294). Comente sobre algumas 
características interessantes dos dados. 


20.9 

19.6 

20,4 

20,3 

20,8 

20,6 

20,5 

20,4 

19.9 

19,8 

19,5 

20.2 

16,5 

18.3 

18,7 

19,6 

20.0 

20,0 

19,5 

19.6 

19,1 

18.8 

18,3 

17,6 

17,2 

17,8 

18,7 

19.0 

19,0 

18,6 

18,8 

19.0 

18,5 

18,3 

17,5 

16,9 

17,0 

17.8 

18,1 

18,8 

18.9 

18,9 

19,1 

18,8 

18,4 

17,8 

17,0 

16,8 

17,9 

18.4 

19,0 

19.4 

19,7 

19,5 

19,5 

19.5 

19,0 

18,7 

18,1 

17,9 





Considere os 

dados 

a seguir 

sobre 

os tipos de queixas 


de saúde (J = inflamação de articulações, F = fadiga, 
B = dor nas costas, M = fadiga muscular, C = tosse, 
N = irritação nasal/coriza, O = outros) feitas por 
agricultores. Obtenha as freqüências e as freqüências 
relativas das diversas categorias e desenhe um his- 
tograma. (Os dados são consistentes com as porcenta- 
gens fornecidas no artigo “Physiological Effects of 
Work Stress and Pesticide Exposure in Tree Planting by 
British Columbia Silviculture Workers,” Ergonomics, 
1993, p. 951-961.) 


30. Um Diagrama de Pareto é uma variação de um his- 
tograma para dados categorizados resultantes de um es- 
tudo de controle de qualidade. Cada categoria representa 
um tipo diferente de não-conformidade de produto ou 
problema de produção. As categorias são ordenadas de 
forma que aquela com maior freqüência seja exibida na 
extremidade esquerda, seguida pela categoria com a se- 
gunda maior freqüência e assim por diante. Suponha que 
as informações a seguir tenham sido obtidas sobre não- 
conformidades em pacotes de circuitos: componentes 
com falha, 126; componentes incorretos, 210: soldas in- 
suficientes, 67; soldas em excesso, 54; falta de compo- 
nentes, 131. Construa um Diagrama de Pareto. 

31. A freqüência acumulada e a freqüência relativa acu- 
mulada de um determinado intervalo de classe são a 
soma das freqüências e freqüências relativas, respecti- 
vamente, desse intervalo e de todos os intervalos abaixo 
dele. Se, por exemplo, houver quatro intervalos com 
freqüências 9, 16, 13 e 12, as freqüências acumuladas 
serão 9, 25, 38 e 50 e as freqüências relativas acumu- 
ladas serão 0,18, 0,50, 0,76 e 1,00. Calcule as freqüên- 
cias acumuladas e as freqüências relativas acumuladas 
para os dados do Exercício 24. 

32. Uma carga de incêndio (MJ/m 2 ) é a energia térmica que 
pode ser liberada por metro quadrado de área de piso 
pela combustão de seu conteúdo e da estrutura em si. O 
artigo “Fire Loads in Office Buildings” (/ of Structural 
Engr. , 1997, p. 365-368) forneceu as seguintes porcen- 
tagens acumuladas (lidas de um gráfico) relativas a car- 
gas de incêndio em uma amostra de 388 salas: 


Valor 

0 

150 

300 

450 

600 

% Acumulada 

0 

19,3 

37,6 

62,7 

77,5 

Valor 

750 

900 

1050 

1200 

1350 

% Acumulada 

87,2 

93,8 

95,7 

98,6 

99,1 

Valor 

1500 

1650 

1800 

1950 


% Acumulada 

99,5 

99,6 

99,8 

100,0 



a. Construa um histograma de freqüência relativa e co- 
mente as características interessantes. 

b. Que proporção das cargas de incêndio é inferior a 
600? Maior ou igual a 1 200? 

c. Que proporção das cargas está entre 600 e 1 200? 


1.3 


Medidas de localização 


Os resumos visuais de dados são excelentes ferramentas para obter impressões e idéias iniciais. Uma análise 
mais formal de dados freqüentemente exige o cálculo e a interpretação de medidas-resumo numéricas simples. 
Isto é, a partir dos dados, tentamos extrair diversos números simples, que servem para caracterizar o conjunto de 
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dados e indicar algumas informações consideráveis. Nossa preocupação principal será com os dados numéricos. 
Alguns comentários sobre dados categorizados serão apresentados no final da seção. 

Suponha, então, que nosso conjunto de dados é do formato x,, x 2 , .... x n , onde cada x é um número. Que 
características de tal conjunto de números são de maior interesse e merecem ênfase? Uma característica impor- 
tante de um conjunto de números é sua localização e, em particular, seu centro. Esta seção apresenta métodos de 
descrição da localização de um conjunto de dados. Na Seção 1.4, apresentaremos os métodos de medida da dis- 
persão de um conjunto de números. 

A média 

Para um determinado conjunto de números x v x, x n , a medida mais familiar e útil do centro é a média do con- 

junto. Como quase sempre temos os vários x constituindo uma amostra, freqüentemente chamaremos a média 
aritmética de média amostrai e a representaremos por x. 


DEFINIÇÃO 


A média amostrai x das observações x v x ,, . 

.. , x n , é dada por 

X, + x, + • 

n 

+ 

h x m /=] 

X — 

n 

n 

O numerador de x pode ser escrito mais informalmente como £x , onde a soma se dá 

sobre todas as observações da amostra. 



Para informar x, recomendamos o uso de precisão decimal de um dígito a mais do que a precisão dos x. 
Dessa forma, se as observações forem distâncias de parada com ac,, = 1 25, x v = 1 3 1 e assim por diante, podemos 
ter x = 127,3 pés. 

Exemplo 1.13 

As trincas em aço e ferro causadas por fadiga de corrosão cáustica foram estudadas em decorrência de falhas em 
rebites de caldeiras de aço e em rotores a vapor. Considere as observações a seguir sobre x = comprimento da 
trinca (/cm) como resultado de testes de fadiga por corrosão devido a cargas constantes em amostras de barras 
de tração lisas durante um período de tempo fixo. (Os dados são consistentes com um histograma e as quanti- 
dades-resumo do artigo “On the Role of Phosphorus in the Caustic Stress Corrosion Cracking of Low Alloy 
Steels”, Corrosion Science, 1989: 53-68.) 

x, = 16,1 x, = 9,6 x, = 24.9 x 4 = 20,4 x 5 = 12,7 x 6 = 21,2 x 7 = 30,2 

x g = 25,8 x 9 = 18,5 x l0 = 10,3 x,, = 25,3 x 12 = 14,0 x l3 = 27,1 x l4 = 45,0 

x |5 = 23,3 x |6 = 24,2 x |7 = 14.6 x |8 = 8.9 x l9 = 32,4 x M = 11,8 x,, = 28.5 

A Figura 1.14 mostra um diagrama de caule e folha dos dados. Um comprimento de trinca no início da faixa 

dos 20 parece ser “típica”. 
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Figura 1.14 Um diagrama de caule e folha dos dados dos comprimentos de trincas 
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Sendo Xr, = 444,8, a média amostrai é 



um valor consistente com as informações ilustradas pelo diagrama de caule e folha. 


Uma interpretação física de x demonstra como ela mede a localização (centro) de uma amostra. Imagine 


desenhar e definir a escala em um eixo horizontal e depois represente cada observação da amostra por um peso 
de uma libra colocado no ponto correspondente no eixo. O único ponto em que pode ser colocado um apoio para 
equilibrar o sistema de pesos é o correspondente ao valor de x (veja a Figura 1.15). 

Da mesma forma que x representa o valor médio das observações de uma amostra, a média de todos os va- 


população)AY. Nos capítulos 3 e 4, forneceremos uma definição mais geral de p que se aplica a populações fini- 


interessante, p é uma característica interessante e importante (freqüentemente a mais importante) de uma popu- 
lação. Nos capítulos sobre inferência estatística, apresentaremos métodos com base na média amostrai para 


21,18 calculada no Exemplo 1.13 como uma estimativa de ponto (um único número que é o “melhor” palpite) 
de /a, o comprimento médio verdadeiro de todas as amostras tratadas como descrito. 


cias: seu valor pode ser bastante afetado pela presença de um único outlier (uma observação incomumente 
grande ou pequena). No Exemplo 1.13, o valor .x, 4 = 45,0 obviamente é um outlier. Sem esta observação, x — 
399,8/20 = 19,99, o outlier aumenta a média em mais de 1 /xm. Se a observação 45,0 pm fosse substituída pelo 
valor catastrófico de 295,0 pm. um outlier realmente extremo, então x = 694,8/21 = 33,09, que é maior que todas 
as observações, exceto uma. 

Uma amostra de salários normalmente produz alguns poucos valores aberrantes (dos sortudos que possuem 
um salário astronômico) e o uso do salário médio como medida de localização freqüentemente será ilusório. 
Esses exemplos sugerem que procuremos uma medida menos sensível a valores fora da faixa que x. assim, pro- 
poremos uma momentaneamente. Entretanto, apesar de x ter essa falha potencial, ela ainda é a medida mais usada, 
em grande parte porque há muitas populações para as quais um outlier extremo na amostra seria altamente im- 
provável. Ao obter uma amostra de uma tal população (a população normal ou em forma de sino, é o exemplo 
mais importante), a média amostrai tenderá a ser estável e muito representativa. 


ordenadas da menor para a maior. Quando as observações estiverem representadas por x x n , usaremos o sím- 

bolo x para representar a mediana amostrai. 


lores da população pode ser calculada. Essa média é denominada média da população e é representada pela 
letra grega p Quando houver N valores na população (uma população finita), p = (somatória dos N valores da 


tas e (conceitualmente) infinitas. Da mesma forma que x é uma medida de localização de amostra importante e 


obtenção de conclusões sobre a média de uma população. Por exemplo: podemos usar a média amostrai x = 


A média sofre de uma deficiência que a toma uma medida de centro inadequada sob algumas circunstân- 


1 = 21,18 


I 


10 



-+ — * 

30 


+ 


40 


Figura 1.15 A média como ponto de equilíbrio de um sistema de pesos 


A mediana 

A palavra mediana é sinônimo de “metade” e a mediana amostrai é o valor do meio quando as observações são 
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DEFINIÇÃO A mediana amostrai é obtida pela ordenação das n observações da menor para a maior 


(com os valores repetidos incluídos, de forma que cada observação da amostra seja exibida 
na lista ordenada). Assim, 


O único 
valor 





enésimo valor ordenado 


x ~ 1 A média 

dos dois 

valores = média dos valores ordenados 
médios se n 
■ for par 



Exemplo 1.14 


O risco de desenvolvimento de deficiência de ferro é especialmente alto durante a gravidez. O problema na de- 
tecção dessa deficiência é que alguns métodos de determinação de nível de ferro podem ser afetados pelo 
próprio estado de gravidez. Considere os dados a seguir sobre a concentração do receptor de transferrina de 
uma amostra de mulheres com evidências laboratoriais de uma visível anemia por deficiência de ferro (“Serum 


Transferrin Receptor for the Detection of Iron Deficiency in Pregnancy,” Anier. J. of Clinicai Nutrition, 1991: 
p. 1077-1081): 


Observe que, se a maior observação, 20,4, não tivesse aparecido na amostra, a mediana amostrai resultante 
para as n = 11 observações teria sido o único valor médio, 9,7 (o (n + l)/2 = sexto valor ordenado). A média 
amostrai é x = 1x/n = 139,3/12 = 1 1,61, que é um pouco maior que a mediana, por causa dos outliers, 15,2, 


Os dados do Exemplo 1.14 ilustram uma propriedade importante de.? em comparação com x: a mediana 
amostrai é muito insensível a muitos valores extremamente pequenos ou extremamente grandes. Se, por exem- 
plo, aumentássemos os dois maiores x. de 16,2 e 20,4 para 26,2 e 30,4, respectivamente, x não seria afetado. 
Dessa forma, no tratamento de valores de dados fora da faixa, xex são extremidades opostas de um espectro: x 
é sensível mesmo a um único valor, enquanto.? é insensível a um grande número de valores fora da faixa. 

Como os valores grandes na amostra do Exemplo 1.14 afetam x mais que .?, x < x para esses dados. Ape- 
sar de x ex fornecerem uma medida para o centro da amostra em um conjunto de dados, eles em geral não serão 
iguais, porque enfocam diferentes aspectos da amostra. 

De forma análoga, x como valor médio na amostra é o valor médio da população, a mediana da po- 
pulação, representada por jü. Como acontece com x e yu, podemos considerar o uso da mediana amostrai jc para 
fazer inferências de fL No Exemplo 1.14, podemos usar.? = 10,05 como estimativa da concentração da media- 
na em toda a população a partir da qual a amostra foi selecionada. Uma mediana normalmente é usada para 
descrever dados de salários ou rendimentos (porque ela não é influenciada por alguns grandes salários). Se a 


jc, = 15,2 jc 2 = 9,3 jc 3 = 7,6 jc 4 = 11,9 jc 5 = 10,4 jc 6 = 9,7 

jr 7 = 20,4 jc g = 9,4 jc, = 1 1,5 jc io = 16,2 jc m = 9,4 x n = 8,3 


A lista dos valores ordenados é 


7,6 8,3 9,3 9,4 9,4 9,7 10.4 11,5 11,9 15,2 16,2 20,4 


Como n = 1 2 é par, tiramos a média n/2 = do sexto e sétimo valores ordenados : 


, 9,7 + 10,4 

mediana amostrai = — — = 10,05 


16,2 e 20,4. 
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mediana de uma amostra dos salários de engenheiros fosse,? = $ 66.416, poderíamos usá-la como base para con- 
cluir que o salário mediano dos engenheiros excede $ 60.000. 

A média da população /jl e a mediana fi normalmente não serão idênticas. Se a distribuição da população 
tiver desvio positivo ou negativo, conforme ilustrado na Figura 1.16, então i± ± Jl. Quando esse for o caso, ao 
fazer inferências, devemos primeiro decidir quais características das populações são de maior interesse e então 
proceder de acordo. 



P m = P m 

(a) Inclinação negativa (b) Simétrica (c) Inclinação positiva 


Figura 1.16 Trés formatos diferentes para uma distribuição de população 


Outras medidas de localização 
Quartis, Percentis e Médias Aparadas 

A mediana (de população ou amostra) divide o conjunto de dados em duas partes de mesmo tamanho. Para obter 
melhores medidas de localização, podemos dividir os dados em mais de duas partes. Grosso modo, os quartis 
dividem o conjunto em quatro partes iguais, sendo que as observações acima do terceiro quartil constituem o 
quarto superior do conjunto de dados, o segundo quartil é idêntico à mediana e o primeiro quartil separa o quarto 
inferior dos três quartos superiores. De forma similar, um conjunto de dados (amostra ou população) pode ser 
dividido mais detalhadamente usando percentis; o 99“ percentil separa o 1% superior do restante, e assim por 
diante. A menos que o número de observações seja um múltiplo de 100, recomenda-se cuidado na utilização de 
percentis. Usaremos percentis no Capítulo 4 com alguns modelos de populações infinitas, de forma que adiare- 
mos a discussão até lá. 

A média amostrai e a mediana amostrai são influenciadas por valores fora da faixa de uma forma bastante 
diferente: muito para a média e nada para a mediana. Como o comportamento extremo dos dois valores é inde- 
sejável, consideraremos medidas alternativas que não sejam tão sensíveis quanto x e nem tão insensíveis comoi 
Para determinar essas alternativas, observe que x ex são extremidades opostas da mesma “família” de medidas. 
Após o conjunto de dados ser ordenado, x é calculado desprezando-se todos os valores possíveis em cada 
extremidade sem eliminar nada (deixando apenas um ou dois valores centrais) e obtendo a média do que restou. 
Por outro lado, para calcular x, nada é desprezado antes de se obter a média. Para fazer uma comparação, a 
média envolve desprezar 0% de cada extremidade da amostra, enquanto, para a mediana, o máximo possível é 
desprezado de cada extremidade. Uma média aparada é algo intermediário entre x ei. Uma média aparada de 
10%, por exemplo, seria calculada eliminando-se os 10% superiores e os 10% inferiores da amostra, obtendo- 
se, então, a média do restante. 

Exemplo 1.15 

Considere as 20 observações a seguir, ordenadas da menor para a maior, cada uma representando a vida útil (em 
horas) de um determinado tipo de lâmpada incandescente: 

612 623 666 744 883 898 964 970 983 1003 

1016 1022 1029 1058 1085 1088 1122 1135 1197 1201 

A média das 20 observações é x = 965,0 ei = 1009,5. A média aparada de 10% é obtida pela exclusão das 
duas menores observações (612 e 623) e as duas maiores (1 197 e 1201) seguida do cálculo da média dos 16 valo- 
res restantes, para obter x irí 10) = 979,1. O efeito de truncar a média aqui é produzir um “valor central” ligei- 
ramente acima da média (x é trazido para baixo por alguns poucos valores de vida útil) e ainda consideravelmente 
abaixo da mediana. De forma similar, a média aparada de 20% faz uma média dos 1 2 valores do meio para obter 
x tr(20 , = 999,9, mais perto ainda da mediana. (Veja a Figura 1.17.) 
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Figura 1.17 Grafico de pontos de vida útil (em horas) de lâmpadas incandescentes 


Geralmente, o uso da média aparada com proporção de aparagem moderada (entre 5% e 25%) produzirá 
uma medida que não é nem tão sensível a outliers como a média nem tão insensível quanto a mediana. Por esse 
motivo, as médias truncadas têm sido objeto de crescente atenção dos estatísticos para propósitos descritivos e 
inferenciais. Mais será dito sobre médias aparadas quando a estimativa por pontos for discutida no Capítulo 6. 
Finalmente, se a proporção de aparagem for representada por a e na não for inteiro, não será óbvio como cal- 
cular a média aparada I00a%. Por exemplo: se a = 0,10 (10%) en = 22, então na = (22)(0,10) = 2,2 e não é 
possível aparar 2,2 observações de cada extremidade da amostra ordenada. Nesse caso, a média aparada de 10% 
seria obtida primeiro com a retirada das duas observações de cada extremidade e pelo cálculo de x ^ seguida pela 
retirada de três observações de cada extremidade e pelo cálculo de * (r . e então pela interpolação dos dois valores 
para obtenção de .r tr(|0) . 

Dados categorizados e proporção de amostras 

Quando os dados são categorizados, uma distribuição de freqüência ou distribuição de freqüência relativa 
fornece um resumo tabular eficiente dos dados. Os indicadores numéricos naturais são, nessa situação, as fre- 
qüências individuais e as freqüências relativas. Por exemplo: se for feita uma pesquisa com indivíduos que pos- 
suem aparelhos de som para estudar a preferência de marca, cada indivíduo da amostra identificaria a marca do 
aparelho que possui. A partir disso poderíamos contar as pessoas que possuem aparelhos Sony, Pioneer, Marantz, 
entre outros. Considere a obtenção de uma amostra de uma população dicotômica, isto é, que consista em ape- 
nas duas categorias (votou ou não votou na eleição passada ou possui ou não um aparelho de som etc.). Se 
fizermos x representar o número da amostra na categoria 1, o número na categoria 2 será n - x. A freqüência re- 
lativa ou proporção amostrai da categoria 1 será x/n e a proporção amostrai da categoria 2 será 1 - x/n. Vamos 
representar uma resposta da categoria 1 por 1 e uma resposta da categoria 2 por 0. Uma amostra de tamanho n 
= 10 pode então resultar em 1, 1, 0, 1, 1, 1, 0, 0, 1, 1. A média dessa amostra numérica é (já que o número de 
ocorrências do número 1 = x = 7) 

*, + . . . + x m 1 + 1 + 0 + -- -+1 + 1 7 * 

n = [o = ”íQ~ - - proporção amostrai 

Esse resultado pode ser generalizado e resumido conforme segue: Se em uma situação de dados catego- 
rizados focarmos a atenção em uma determinada categoria e codificarmos os resultados da amostra de forma 
que 1 seja registrado como um indivíduo da categoria e 0 para um indivíduo fora dela , a proporção amostrai 
de indivíduos da categoria será a média amostrai da sequência de ls e 0s. Assim, uma média amostrai pode ser 
usada para resumir os resultados de uma amostra categorizada. Essas observações também se aplicam a situações 
em que as categorias são definidas por valores agrupados em uma amostra ou população numérica (por exem- 
plo: podemos querer saber se os indivíduos possuem seu automóvel atual há pelo menos cinco anos em vez de 
estudarmos o tempo exato de posse). 

De forma análoga à proporção amostrai x/n de indivíduos que estão em uma determinada categoria, repre- 
sentemos por p a proporção dos indivíduos da população inteira que pertencem à categoria. Como acontece com 
x/n, p é uma quantidade entre 0 e 1 e, enquanto x/n é uma característica da amostra, p é uma característica da 
população. A relação entre os dois é semelhante à relação entrei e jú e entre x e p. Em particular, usaremos x/n 
para fazer inferências sobre p. Se, por exemplo, uma amostra de 1 00 proprietários de carros revelar que 22 possuem 
seus carros há pelo menos 5 anos, podemos usar 22/100 = 0,22 como uma estimativa pontual da proporção 
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de todos os proprietários que possuem o carro há pelo menos 5 anos. Estudaremos as propriedades de x/n como 
um estimador de p e veremos como x/n pode ser usado para responder a outras questões inferenciais. Com k ca- 
tegorias (k> 2), podemos usar as proporções amostrais de k para responder a questões sobre as proporções da 
população p,, ... , p r 


Exercícios | Seção 1 .3 (33-43) 

33. O artigo ‘The Pedaling Technique of Elite Endurance 
Cyclists” (Int. J. of Sport Biomechanics, 1991, p. 29- 
53) relatou os dados a seguir sobre a potência de uma 
única perna de um ciclista em alta carga de trabalho: 

244 191 160 187 180 176 174 

205 211 183 211 180 194 200 

a. Calcule e interprete a média e a mediana amostrais. 

b. Suponha que a primeira observação tenha sido 204 
em vez de 244. Como a média e a mediana seriam 
afetadas? 

c. Calcule uma média aparada, eliminando a maior e a 
menor observações da amostra. Qual é a porcen- 
tagem de truncamento correspondente? 

d. O artigo também relatou valores sobre a potência de 
uma única perna para uma carga de trabalho baixa. 
A média amostrai de n = 13 observações foi x = 
1 19,8 (na verdade 1 19,7692) e a 14 a observação, um 
tipo de outlier , foi 159. Qual é o valor de 3c para a 
amostra toda? 

34. Considere as observações a seguir sobre resistência ao 
cisalhamento (MPa) de uma junta soldada de uma de- 
terminada forma (de um gráfico no artigo “Diffusion of 
Silicon Nitride to Austenitic Stainless Steel without In- 
terlayers,” Metallurgical Trans., 1993, p. 1835-1843): 

22,2 40,4 16,4 73,7 36,6 109,9 

30.0 4,4 33,1 66,7 81,5 

a. Determine o valor da média amostrai. 

b. Determine o valor da mediana amostrai. Por que 
esse valor é tão diferente da média? 

c. Calcule a média aparada, excluindo a menor e a 
maior observações. Qual é a porcentagem de trunca- 
mento correspondente? Como o valor de x^ se com- 
para à média e à mediana? 

35. A pressão mínima de injeção (psi) em amostras de 
moldagem por injeção de milho de alta amilose foi de- 
terminada para oito amostras diferentes (pressões mais 
altas correspondem a maior dificuldade de processa- 
mento), resultando nas observações a seguir (de “Ther- 
moplastic Starch Blends with a Polyethylene-Co-Vinyl 
Alcohol: Processability and Physical Properties,” Poly- 
mer Engr and Science, 1994, p. 17-23): 

15.0 13,0 18,0 14,5 12,0 11,0 8,9 8,0 

li i i 

a. Determine os valores da média amostrai, mediana 
amostrai e média aparada de 12,5% e os compare. 


b. Em quanto a menor observação da amostra, atual- 
mente 8,0, pode ser aumentada sem afetar o valor da 
mediana amostrai? 

c. Suponha que desejemos que os valores da média e 
da mediana amostrais sejam expressos em quilogra- 
mas por polegada quadrada (ksi) em vez de psi. É 
necessário mudar as unidades de cada observação ou 
os valores calculados na parte (a) podem ser usados 
diretamente? Dica: lkg = 2,21b. 

36. Vinte e seis trabalhadores de plataformas de petróleo 
offshore participaram de um exercício de fuga simu- 
lado, resultando nos dados a seguir (em segundos) para 
concluir a fuga (“Oxygen Consumption and Ventilation 
During Escape from an Offshore Platform,” Ergono- 
mics, 1997, p. 281-292): 

389 356 359 363 375 424 325 394 402 

373 373 370 364 366 364 325 339 393 

392 369 324* 359 356 403 334 397 

a. Construa um diagrama de caule e folha dos dados. 

Como ele sugere que a média e mediana serão com- 
paradas? 

b. Calcule os valores da média e da mediana amostrais. 
Dica: £jc = 9638. 

c. Em quanto o maior tempo, atualmente 424, pode ser 
aumentado sem afetar o valor da mediana amostrai? 
Em quanto esse valor pode ser diminuído sem afetar 
o valor da mediana amostrai? 

d. Quais são os valores de x e x quando as observações 
são reexpressas em minutos? 

37. O artigo “Snow Cover and Temperature Relationships in 
North America and Eurasia” (J. Climate and Applied Me- 
teorology, 1983, p. 460-469) usou técnicas estatísticas 
para relacionar a quantidade de cobertura de neve em 
cada continente com a temperatura média continental. Os 
dados apresentados incluíram as 10 observações a seguir 
sobre a cobertura de neve, em outubro, na Eurásia, du- 
rante 1970 e 1979 (em milhões de km 2 ): 

6,5 12,0 14,9 10,0 10,7 7,9 21,9 12,5 14,5 9,2 

O que você descreveria como valor característico ou 
representativo da cobertura de neve em outubro para 
esse período e o que o levou a essa escolha? 

38. Os valores de pressão sangüínea freqüentemente são in- 
formados com aproximação de 5 mmHg (100, 105, 110 
etc.). Suponha que os valores reais (sem aproximação) 
de pressão sangüínea de nove indivíduos selecionados 
aleatoriamente sejam 
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1 18,6 127,4 138,4 130,0 113,7 122,0 108,3 131,5 
133,2 

a. Qual é a mediana dos valores de pressão sangüínea 
informados! 

b. Suponha que a pressão sangüínea do segundo indi- 
víduo seja 127,6 em vez de 127,4 (uma pequena 
alteração em um único valor). Como isso afeta a 
mediana dos valores informados? O que isso diz so- 
bre a sensibilidade da mediana ao arredondamento 
ou agrupamento dos dados? 

39. A propagação de trincas por fadiga em diversas peças 
de aeronaves tem sido objeto de muitos estudos nos úl- 
timos anos. Os dados a seguir consistem dos tempos de 
propagação (horas de vôo/10 4 ) para atingir um determi- 
nado tamanho de trinca em furos de fixadores propostos 
para uso em aeronaves militares (“Statistical Crack 
Propagation in Fastener Holes under Spectrum Load- 
ing ” J. Aircraft, 1983, p. 1028-1032): 

0,736 0,863 0,865 0,913 0,915 0,937 0,983 1,007 
1,011 1,064 1,109 1,132 1,140 1,153 1,253 1,394 

a. Calcule e compare os valores da média e da mediana 
amostrais. 

b. Em quanto a maior observação da amostra pode ser 
diminuída sem afetar o valor da mediana? 

40 . Calcule a mediana amostrai, a média aparada de 25%, a 
média aparada de 10% e a média amostrai para os da- 
dos de concentração fornecidos no Exercício 27 e com- 
pare essas medidas. 

41 . Uma amostra de n = 10 automóveis foi selecionada e 
cada um deles foi sujeito a um teste de colisão a 5 mph. 
Representando um carro sem danos visíveis por S (de 


sucesso) e um carro com danos por F, os resultados são 
os seguintes: 

SSFSSSFFSS 

a. Qual é o valor da proporção amostrai de suces- 
sos x In ? 

b. Substitua cada S por 1 e cada F por 0. Calcule então 
x para essa amostra codificada numericamente. 
Como x pode ser comparado a x/n ? 

c. Suponha que se decidiu incluir mais 15 carros no 
experimento. Quantos deles teriam de ser S para 
fornecer x/n = 0,80 para a amostra de 25 carros? 

42 . a. Se uma constante c é adicionada a cada x. de uma 

amostra, resultando em y. = jc + c, como a média e a 
mediana amostrais dos y. se relacionam com a média 
e a mediana dos jc? Verifique suas hipóteses, 
b. Se cada x. é multiplicado por uma constante c, resul- 
tando em y. = cjc., responda à questão da parte (a). 
Verifique novamente suas hipóteses. 

43 . Um experimento para estudar a vida útil (em horas) de 
certo tipo de componente consiste em colocar dez com- 
ponentes em operação e observá-los por 100 horas. 
Oito dos componentes apresentaram falhas nesse perío- 
do e esses valores de vida útil foram registrados. Re- 
presente os tempos de vida útil dos dois componentes 
que ainda funcionam após 100 horas por 100 -k As ob- 
servações resultantes foram 

iC %c 2t> 

48 79 100+ 35 92 86 57 100+ 17 29 

A 1 l 

Que medidas de tendência central discutidas nesta seção 
podem ser calculadas e quais são os valores dessas me- 
didas? (Nota: Os dados deste experimento são “cen- 
surados pela direita”.) 


1.4 


Medidas de Dispersão 


Informar apenas a medida de tendência central fornece apenas informações parciais sobre um conjunto de dados 
ou uma distribuição. Diferentes amostras ou populações podem ter medidas de tendência central idênticas e apre- 
sentar diferenças entre si em outros aspectos importantes. A Figura 1.18 apresenta gráficos de pontos de três 
amostras com a mesma média e a mesma mediana, mas com dispersões diferentes ao redor do centro. A primeira 
amostra é a que apresenta maior dispersão, a terceira a menor e a segunda é intermediária em relação a elas. 


Medidas de dispersão para dados amostrais 

A medida de dispersão mais simples de uma amostra é a amplitude, a diferença entre o maior e o menor valores 
da amostra. Observe que o valor da amplitude da amostra 1 da Figura l . 1 8 é muito maior do que o da amostra 
3, o que reflete maior dispersão na primeira amostra do que na terceira. Um defeito da amplitude, entretanto, é 
que ela depende apenas das duas observações mais extremas e não considera as posições dos n - 2 valores 
restantes. As amostras 1 e 2 na Figura 1.18 possuem amplitudes idênticas mas, se levarmos em conta as obser- 
vações entre os dois extremos, há muito menos dispersão na segunda amostra do que na primeira. 
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Figura 1.18 Amostras com medidas centrais idênticas mas com variabilidade diferente 


Nossa principal medida de dispersão envolve os desvios em relação à média, jc, - x , x 2 -x, .... , x - x. Ou 
seja, os desvios da média são obtidos pela subtração de x de cada uma das n observações da amostra. Um desvio 
será positivo se a observação for maior que a média (à direita da média no eixo das medidas) e negativo se a ob- 
servação for menor que a média. Se todos os desvios forem pequenos em magnitude, todos os x. estarão próxi- 
mos à média e haverá pouca dispersão. Por outro lado, se alguns desvios forem grandes, alguns x. estarão dis- 
tantes de x, indicando maior dispersão. Uma forma simples de combinar os desvios em uma única quantidade é 
calcular a sua média (somá-los e dividi-los por n). Infelizmente, há um problema grave com essa sugestão: 

n 

somatória dos desvios = X (x , . — x) = 0 

i— 1 

de forma que o desvio será sempre zero. A demonstração usa diversas regras-padrão de somatória e o fato de que 
£5 = x + x + • • • +x = nx\ 


X(x - x) = Zx i - Zx = Z*, ~nx = Zx i ~ j = 0 

Como podemos alterar os desvios para quantidades não-negativas de forma que os desvios positivos e 
negativos não se cancelem quando forem somados? Uma possibilidade é trabalhar com os valores absolutos e 
calcular o desvio médio absoluto Z I x. — x \ In. Como a operação em valor absoluto conduz a diversas dificul- 
dades teóricas, considere os quadrados dos desvios — 3c) 2 , (.r, — 3c) 2 . — » i x n ~ x) 2 - Em vez de usar o quadrado 
do desvio médio Z{x j — x) 2 /n, por diversos motivos, dividiremos a soma dos quadrados dos desvios por n - 1 
em vez de n. 


DEFINIÇÃO 


A variância amostrai, representada por s 2 , é dada por 

= Z(x ~ xl = _S jí _ 
n - 1 n — 1 

O desvio padrão amostrai, representado por s, é a raiz quadrada (positiva) 
da variância: 

5 = V? 


A unidade de s é a mesma de cada um dos x.. Se, por exemplo, as observações forem consumo de com- 
bustível em milhas por galão, podemos ter .v = 2,0 milhas/galão. Uma interpretação grosseira do desvio padrão 
da amostra é que ele é o tamanho de um desvio típico ou representativo da média amostrai para a amostra sele- 
cionada. Dessa forma, se s = 2,0 milhas/galão, então alguns x. da amostra estão dentro do intervalo x mais de 
que 2,0, enquanto outros estão mais distantes; 2,0 é um desvio representativo (ou “padrão”) do consumo médio 
de combustível. Se 5 = 3,0 para uma segunda amostra de carros de outro tipo, um desvio típico dessa amostra é 
cerca de 1,5 vez maior do que na primeira amostra, indicando maior dispersão da segunda. 


Visão Geral e Estatística Descritivo - Jay l Devore 33 


Exemplo 1.16 

A resistência é uma importante característica de materiais usados em casas pré-fabricadas. Cada um dos n = 1 1 
elementos de placas pré-fabricadas foi submetido a um teste de tensão severo e a largura máxima (mm) das trin- 
cas resultantes foi registrada. Os dados fornecidos (Tabela 1.3) foram relatados no artigo “Prefabricated Ferro- 
cement Ribbed Elements for Low-Cost Housing” (J. Ferrocement, 1984, p. 347-364). Consequências do 
arredondamento influenciam para a soma dos desvios não ser e xatamen te nula. O numerador de s 2 é 1 1 ,9359, 
portanto s 2 = 11,9359/(11 - 1) = 11,9359/10= 1,19359 e j = Vl, 19359 = 1,0925 mm. ■ 


Tabela 1.3 Dados do Exemplo 116 



x. — X 

(x - X) 2 

0,684 

-0,9841 

0,9685 

2,540 

0,8719 

0,7602 

0,924 

-0,7441 

0,5537 

3,130 

1,4619 

2,1372 

1,038 

-6301 

0,3970 

0,598 

-1,0701 

1,1451 

0,483 

-1,1851 

1,4045 

3,520 

1,8519 

3,4295 

1,285 

-0,3831 

0,1468 

2,650 

0,9819 

0,9641 

1,497 

-0,1711 

0,0293 

X.r, = 18,349 

_ 18.349 

x = = 1,6681 

Xo* -x) = -0.0001 

s„ = Xo* - x ) 2 = 1 1.9359 


Dedução de s 2 

Para explicar por que s 2 deve ser usado em vez do quadrado do desvio médio para medir a dispersão, observe 
primeiro que, enquanto s 2 mede a dispersão da amostra, há uma medida de dispersão da população denominada 
variância da população. Usaremos a 2 (o quadrado da letra grega minúscula sigma) para representar a variân- 
cia da população e cr para representar o desvio padrão da população (a raiz quadrada de cr 2 ). Quando a popula- 
ção é finita e consiste de N valores, 

N 

<r 2 = X (*, - p) 2 /N 

Í= 1 

que é a média de todos qs quadrados dos desvios da média da população (no caso de população, o divisor é Ne 
não N - 1 ). Definições mais gerais de cr 2 são apresentadas nos capítulos 3 e 4. 

Da mesma forma que x é usado para fazer inferências sobre a média da população p, devemos definir a va- 
riância da amostra de maneira que possa ser usada para fazer inferências sobre cr. Observe que cr envolve os 
quadrados dos desvios em tomo da média da população p. Se conhecêssemos o valor real de p, poderíamos en- 
tão definir a variância da amostra como o quadrado do desvio médio da amostra x em tomo de p. Entretanto, o 
valor de p quase nunca é conhecido, de modo que deve ser usada a soma dos quadrados dos desvios em tomo 
de x. Todavia, os x tendem a estar mais próximos de sua média do que da média da população p. assim, para 
compensar tal fato, é usado o divisor n - 1 em vez de n. Em outras palavras, se usássemos o divisor n na fór- 
mula da variância da amostra, quantidade resultante tenderia a subestimar cr (gerar valores na média muito pe- 
quenos para a estimativa), enquanto a divisão pelo valor, ligeiramente menor, n — 1 corrige a subestimativa. 
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É costume se referir a x 2 como tendo n — 1 graus de liberdade (gl) como base. Essa terminologia resulta 
do fato de que, apesar de x 2 ter como base as n quantidades jc, — ~x, x 2 - x, ... , x n — x, sua soma é nula. Assim, 
especificar os valores de qualquer n — 1 das quantidades determina o valor restante. Por exemplo: se n = 4cx t 
— x = 8, x 2 -x= —6 e x A ~x = —4, automaticamente x 3 — x = 2, de forma que apenas três dos quatro valores 
de x. - x serão determinados livremente (3 gl). 

Uma fórmula para o cálculo de s 2 

O cálculo dos quadrados dos desvios é tedioso, especialmente se for usada para x precisão decimal suficiente 
para prevenir os efeitos de arredondamento. Uma fórmula alternativa para o numerador de s 2 evita a necessidade 
de todas as subtrações para obter os desvios. A fórmula envolve (X*,)‘, somando e depois obtendo os quadrados 
e X-**, obtendo os quadrados e depois somando. 


Uma expressão alternativa para o numerador de s 2 é 


S a = X(* - x) 2 = Xx 2 - 



n 


Demonstração Como x = Xx/n, nx 2 = (XxX/n. Então, 

XO, - x ) 2 = Xix 2 - 2x • x. + x 2 ) = Xx) - 2x X* + E(x) 2 
= Xx 2 — 2x • nx + n(x) 2 = Xx 2 — n(x) 2 


Exemplo 1.17 

A quantidade de reflexão de luz pelas folhas foi usada para diversos propósitos, incluindo a avaliação da cor da 
plantação de grama, a estimativa do status de nitrogênio e a medida de biomassa. O artigo “Leaf Reflectance- 
Nitrogen-Chlorophyll Relations in Buffel-Grass” (Photogrammetric Engr. and Remote Sensing, 1985, p. 463- 
466) forneceu as observações a seguir, obtidas usando espectrofotogrametria, sobre a reflexão das folhas sob 
condições experimentais especificadas. 


Observação 

X. 

i 

1 

Observação 

JC. 

t 

*í 

1 

15,2 

231,04 

9 

12,7 

161,29 

2 

16,8 

282,24 

10 

15,8 

249.64 

3 

12,6 

158,76 

11 

19,2 

368.64 

4 

13,2 

174,24 

12 

12,7 

161,29 

5 

12,8 

163,84 

13 

15,6 

243,36 

6 

13,8 

190,44 

14 

13,5 

182,25 

7 

16,3 

265,69 

15 

12,9 

166,41 

8 

13,0 

169,00 





Xx, = 216,1 Xx 2 = 3168,13 


A fórmula de cálculo fornece 

S = X x 2 

XX I 


= 3.68,13 

= 3168,13 - 3113,28 = 54,85 


de onde x 2 = S J(n - 1) = 54,85/14 = 3,92 e x = 1,98. ■ 
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O método alternativo pode resultar em valores de s 2 e s diferentes dos valores calculados, usando as 
definições. Essas diferenças se devem a efeitos de arredondamento e não serão importantes na maioria das 
amostras. Para minimizar os efeitos de arredondamento ao usar a fórmula alternativa, os cálculos intermediários 
devem ser feitos usando-se vários dígitos significativos a mais do que serão mantidos na resposta final. Como o 
numerador de s 2 é a soma de quantidades não-negativas (quadrados desvios), s 2 é com certeza não-negativo. 
Ainda assim, se for usada alternativa, particularmente com dados de pouca dispersão, um pequeno erro numérico 
pode resultar em um numerador negativo (£.r menor que d.r)7n). Se o valor de s 2 for negativo, foi cometido 
um erro de cálculo. 

Diversas outras propriedades de s 2 podem facilitar esse cálculo. 


PROPOSIÇÃO 


Considere Jt,, x 2 x n como uma amostra e c como uma constante qualquer diferente 

de zero. 

1. Se y, = Jt, + c, y 2 = x 2 + c , . . . , y n = x n + c, então s 2 = s 2 ^ e 

2. Se y t = cx v . . . , y n = cx n , então sj = cV, s y = I c | s x , 

onde s 2 é a variância amostrai dos res ! éa variância amostrai dos v. 

i y * 


Em palavras, o resultado 1 informa que, se uma constante c for adicionada a (ou subtraída de) cada valor 
dos dados, a variância não será alterada. Isso é intuitivo, já que a adição ou a subtração de c altera a localização 
do conjunto de dados, mas mantém as distâncias entre os valores inalteradas. De acordo com o resultado 2, a 
multiplicação de cada x. por c resulta em s 2 , sendo multiplicado por um fator de c 2 . Essas propriedades podem 
ser demonstradas pela observação de que y = x + c no resultado 1 e de que y = cx no resultado 2. 

Boxplots 

Diagramas de caule e folha e histogramas conduzem a impressões gerais sobre um conjunto de dados, enquanto 
um único valor como a média ou o desvio padrão enfoca apenas um aspecto dos dados. Nos últimos anos. um 
resumo esquemático denominado boxplot vem sendo usado para descrever as características mais proeminentes 
de conjuntos de dados. Essas características incluem (1) centro, (2) dispersão, (3) a extensão e a natureza de 
qualquer desvio em relação à simetria e (4) a identificação de outliers, observações que normalmente estão dis- 
tantes da maior parte dos dados. Como apenas um outlier pode afetar drasticamente os valores de x e 5, um 
boxplot é baseado em medidas “resistentes” à presença de alguns outliers: a mediana e uma medida de disper- 
são denominada dispersão entre os quartos. 


DEFINIÇÃO 


Ordene as n observações da menor para a maior e então separe a metade menor da 
maior. A mediana x estará incluída em ambas as partes se n for ímpar. Então o quarto 
inferior será a mediana da metade menor e o quarto superior será a mediana da 
metade maior. Uma medida de dispersão resistente a outliers é a dispersão entre os 
quartos f ; , dada por 

f t = quarto superior — quarto inferior 


Grosso modo , a dispersão entre os quartos não será alterada pelas posições das observações nos menores 
25% ou nos maiores 25% dos dados. 

O boxplot mais simples tem base no seguinte resumo de cinco números: 


menor x, quarto inferior mediana quarto superior maior x. 


36 Probabilidade e Estatística - Editora Thomson 


Primeiro, desenhe um eixo de medida horizontal. Então, coloque um retângulo sobre o eixo; a extremidade es- 
querda do retângulo estará no quarto inferior e a extremidade direita estará no quarto superior (de forma que a 
largura da caixa = f ). Trace um segmento de reta vertical ou outro símbolo dentro do retângulo na posição da 
mediana. A posição do símbolo da mediana em relação às duas extremidades indica informações sobre o desvio 
nos 50% centrais dos dados. Por fim, desenhe “bigodes” saindo de cada extremidade do retângulo para as ob- 
servações maior e menor. Um boxplot com uma orientação vertical também pode ser desenhado, fazendo-se 
modificações óbvias no processo de construção. 

Exemplo 1.18 

O ultra-som foi usado para obter informações sobre dados de corrosão na espessura da chapa do assoalho de um 
reservatório elevado usado para armazenar óleo bruto (“Statistical Analysis of UT Corrosion Data from Floor 
Plates of a Crude Oil Aboveground Storage Tank” Materials Eval . , 1994, p. 846-849). Cada observação é a 
maior profundidade do orifício na placa, expressa em milipolegadas. 


40 52 55 60 70 75 85 85 90 90 92 94 94 95 98 100 115 125 125 


O resumo de cinco números segue: 

menor x. = 40 quarto inferior = 72,5 x = 90 quarto superior = 96,5 
maior x = 125 

A Figura 1.19 exibe o boxplot resultante. A extremidade direita da caixa está muito mais próxima da me- 
diana do que a esquerda, indicando um desvio substancial na parte central dos dados. A largura da caixa (f) tam- 
bém é relativamente grande em relação à amplitude dos dados (distância entre as pontas dos bigodes). 



-I 1 1 1 1 1 1 1 1 1 — ► Profundidade 

40 50 60 70 80 90 100 110 120 130 

Figura 1.19 Um boxplot dos dados de corrosão 


A Figura 1 .20 mostra o resultado do M1NITAB de uma solicitação de descrição dos dados de corrosão. A 
média aparada é a média das 1 7 observações que permanecem após a exclusão do maior e do menor valores (por- 
centagem de truncamento 555 5%). Q1 e Q3 são os quartis inferior e superior. Eles são similares aos quartos, mas 
calculados de uma forma ligeiramente diferente. A Média SE é s/vn, quantidade que será importante no tra- 
balho subseqüente em inferências de p. 


Variável 

N 

Média 

Mediana 

Média Ap 

Desv Padrão 

profundidade 

19 

86,32 

90,00 

86,76 

23,32 

Variável 

Minimo 

Máximo 

Q1 

Q3 


profundidade 

40,00 

125,00 

70,00 

98,00 



Figura 1.20 Descrição em MINITAB dos dados de profundidade do orifício 


Média SE 
5,35 


Boxplots com Outliers 

Um boxplot pode ser formatado para indicar explicitamente a presença de outliers. 
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DEFINIÇÃO 


Qualquer observação distante mais do que 1 ,5/ do quarto mais próximo é um outlier. 
Um outlier é extremo se estiver a mais de 3/ t do quarto mais próximo. Caso contrário, 
é moderado. 


Muitos procedimentos inferenciais se baseiam na suposição de que a amostra é proveniente de uma dis- 
tribuição normal. Mesmo um único outlier extremo na amostra avisa o investigador de que tais procedimentos 
não devem ser usados e a presença de diversos outliers moderados passa a mesma mensagem. 

Modifiquemos agora nossa construção anterior de um boxplot, desenhando um “bigode” em cada ex- 
tremidade da “caixa”, para que a menor e a maior observações não sejam outliers. Cada outlier moderado é 
representado por um círculo cheio e cada outlier extremo é representado por um círculo vazio. Alguns softwares 
estatísticos não fazem distinções entre outliers extremos e moderados. 


Exemplo 1.19 

Os efeitos de descargas parciais na degradação de materiais de cavidades isolante têm importantes implicações 
na vida útil de componentes de alta voltagem. Consideremos a seguinte amostra de n = 25 larguras de pulso de 
descargas lentas em uma cavidade cilíndrica de polietileno. (Esses dados são consistentes com um histograma 
de 250 observações no artigo “Assessment of Dielectric Degradation by Ultrawide-band PD Detection,” IEEE 
Trans. on Dielectrics and Elec. Insul., 1995, p. 744-760.) O autor do artigo nota o impacto de diversas ferra- 
mentas estatísticas na interpretação dos dados de descarga. 


5,3 

8,2 

13,8 

74,1 

85,3 

88,0 

90,2 

94,9 

95,5 

95,8 

95,9 

96,6 

96,7 

98,1 


91,5 92,4 92,9 

99,0 101,4 103,7 


93,6 94,3 94,8 

106.0 113,5 


Os indicadores relevantes são 




x = 94,8 quarto inferior = 90,2 quarto superior = 96,7 
4 = 6,5 1,5/; = 9,75 3/ t = 19,50 


Dessa forma, qualquer observação menor que 90,2 - 9,75 = 80,45 ou maior que 96,7 + 9,75 = 106,45 é 
um outlier. Há um outlier na extremidade superior da amostra e quatro outliers na inferior. Como 90,2 - 1 9,5 = 
70,7, as três observações: 5,3, 8,2 e 13,8 são outliers extremos. Os outros dois outliers são moderados. Os 
“bigodes” se estendem até 85,3 e 106.0, as observações mais extremas que não são outliers. O boxplot resultante 
está na Figura 1.21. Há desvio negativo grande na parte central da amostra, assim como na amostra inteira. 


OO O 


1 ' 1 ► Largura do pulso 

0 50 100 

Figura 1.21 Um boxplot dos dados de largura de pulso que exibem outliers extremos e moderados ■ 




Boxplots Comparativos 

Um boxplot comparativo ou lado a lado é uma forma muito eficiente de revelar semelhanças e diferenças entre 
dois ou mais conjuntos de dados consistindo de observações da mesma variável. 
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Exemplo 1.20 

Nos últimos anos, algumas evidências sugerem que a alta concentração de radônio em ambientes fechados pode 
estar ligada ao desenvolvimento de cânceres infantis, mas muitos profissionais da saúde não estão convencidos. Um 
artigo recente (“Indoor Radon and Childhood Câncer”, The Lancet, 1991, p. 1537-1538) apresentou os seguintes 
dados sobre a concentração de radônio (Bq/m 3 ) em duas amostras diferentes de casas. A primeira amostra con- 
sistia de casas em que havia residido uma criança com diagnóstico de câncer. As casas da segunda amostra não 
possuíam casos registrados de câncer infantil. A Figura 1 .22 apresenta um diagrama de caule e folha dos dedos. 


1. Câncer 


2. Ausência de câncer 


9683795 

86071815066815233150 

12302731 
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4 
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95768397678993 

12271713114 

99494191 

839 

55 

Caule: Dígito das dezenas 
5 Folha: Dígito das unidades 


Figura 1.22 Diagrama de caule e folha do Exemplo 1 .20 


As quantidades numéricas resumidas são as seguintes: 



X 

X 

s 

fs 

Câncer 

22,8 

16,0 

31,7 

11,0 

Sem câncer 

19,2 

12,0 

17,0 

18,0 


Os valores da média e da mediana sugerem que a amostra de câncer está centrada um pouco à direita da 
amostra de ausência de câncer na escala de medida. A média, entretanto, exagera a grandeza do desvio, princi- 
palmente devido ao valor 210 na amostra de câncer. Os valores de s sugerem dispersão maior na amostra de 
câncer do que na amostra de ausência de câncer, mas essa impressão é contrariada pela quarta dispersão. Nova- 
mente, a observação 210, um outlier extremo, é a culpada. A Figura 1.23 mostra um boxplot comparativo do pa- 
cote de software S-Plus. A caixa dos indivíduos com ausência de câncer é mais extensa se comparada à caixa de 
câncer (f s = 18 vs.f s =11), além disso, as posições das retas das medianas mostram desvio maior na metade da 
amostra de ausência de câncer do que na amostra de câncer. Os outliers são representados por segmentos de reta 
horizontais e não há distinção entre outliers moderados e extremos. 


Concentração 
de radônio 



Figura 1.23 Um boxpiot dos dados do Exemplo 1 .20, no S-Plus 
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Exercícios 


Seção 1.4 (44-61) 


44. O artigo “Oxygen Consumption During Fire Suppres- 
sion: Error of Heart Rate Estimation” (Ergonomics, 
1991. p. 1469-1474) informou os dados a seguir sobre 
consumo de oxigênio (mL/kg/min) para uma amostra 
de 10 bombeiros em uma simulação de supressão de in- 
cêndio: 

29,5 49,3 30,6 28,2 28,0 26,3 33,9 29,4 23,5 31,6 
Calcule: 

a. A amplitude amostrai. 

b. A variância amostrai s 2 pela definição (ou seja, pri- 
meiro calculando os desvios e depois obtendo os 
quadrados etc.). 

c. O desvio padrão amostrai. 

d. s 2 usando o método alternativo. 

45. O valor do módulo de Young (GPa) foi determinado para 
chapas fundidas feitas de algumas substâncias metálicas, 
resultando nas observações a seguir (“Strength and 
Modulus of a Molybdenum-Coated Ti-25Al-10Nb-3U- 
lMo Intermetallic,” J. of Materials Engr. and Perfor- 
mance, 1997, p. 46-50): 


116,4 115,9 114,6 115,2 115,8 


a. Calcule x e os desvios em relação à média. 

b. Use os desvios calculados na parte (a) para obter a 
variância amostrai e o desvio padrão amostrai. 

c. Calcule s 2 usando a fórmula do numerador S . 

XX 

d. Subtraia 100 de cada observação para obter uma 
amostra de valores transformados. Agora calcule a 
variância amostrai desses valores transformados e a 
compare ao s 2 dos dados originais. 

46 . As observações a seguir da viscosidade estabilizada 
(cP) para amostras de certo tipo de asfalto com 18% de 
borracha adicionada são do artigo “Viscosity Charac- 
teristics of Rubber-Modified Asphalts” (J. of Materials 
in Civil Engr, 1996, p. 153-156): 

2781 2900 3013 2856 2888 


e interprete o desvio padrão amostrai. (Dica: X* = 
9638 eX* 2 = 3.587.566.) 

49. Um estudo da relação entre idade e diversas funções vi- 
suais (como precisão e percepção de profundidade) in- 
formou as seguintes observações da área de lâmina es- 
cleral (mm : ) nas extremidades do nervo óptico humano 
(“Morphometry of Nerve Fiber Bundle Pores in the Op- 
tic Nerve Head of the Human,” Experimental Eye Re- 
search , 1988, p. 559-568): 

2,75 2,62 2,74-3,8512,34 2,74 3,93 4,21 3,88 

4,33 3,46 4,52i 2,43 3,65,2,78 3,56 3,01 

a. Calcule Xjc e Xx 2 . 

b. Use os valores calculados na parte (a) para obter a 
variância amostrai s 2 e o desvio padrão amostrai s. 

50 . Em 1997, uma mulher processou um fabricante de te- 
clados de computadores, sob a acusação de lesões por 
esforços repetitivos causados pelo teclado (Genessy v. 
Digital Equipment Corp.). O pleito era de cerca de 3,5 
milhões de dólares por danos físicos, mas a corte negou 
esse valor pois julgou a indenização exagerada. Ao fazer 
essa determinação, a corte identificou um grupo “nor- 
mativo” de 27 casos similares e especificou como razoá- 
vel uma indenização limitada por dois desvios padrão 
em relação à média das indenizações dos 27 casos. As 
27 indenizações foram (em milhares de dólares) 37, 60, 
75, 115, 135, 140, 149, 150, 238, 290, 340, 410, 600, 
750, 750, 750, 1050, 1100, 1139, 1150, 1200, 1200, 
1250, 1576, 1700, 1825 e 2000, das quais X* = 
20.179, X*f = 24.657.51 1. Qual é o valor máximo que 
pode ser indenizado pela regra de dois desvios padrão? 

5L O artigo “A Thin-Film Oxygen Uptake Test for the 
Evaluation of Automotive Crankcase Lubricants” (Lu- 
bric. Engr. , 1984, p. 75-83) informou os seguintes 
dados sobre tempo de oxidação-indução (min) para di- 
versos óleos comerciais: 


a. Quais são os valores da média amostrai e da media- 
na amostrai? 

b. Calcule a variância amostrai usando a fórmula. 
(Dica: Primeiro subtraia um valor conveniente de 
cada observação.) 

47 . Calcule e interprete os valores da mediana amostrai, da 
média amostrai e do desvio padrão amostrai das obser- 
vações a seguir da resistência à ruptura (MPa, lidas de 
um gráfico de “Heat-Resistant Active Brazing of Sili- 
con Nitride: Mechanical Evaluation of Braze Joints,” 
Welding J., August, 1997): 

87 93 96 98 105 114 128 131 142 168 

48 . O Exercício 36 na Seção 1.3 apresentou uma amostra 
de 26 tempos de fuga dos trabalhadores de uma plata- 
forma de petróleo em uma simulação de fuga. Calcule 


87 103 130 160 180 195 132 145 211 105 145 
153 152 138 87 99 93 119 129 

a. Calcule a variância e o desvio padrão amostrais. 

b. Se as observações fossem especificadas em horas, 
quais seriam os valores resultantes para a variância e 
para o desvio padrão amostrais? Responda sem 
reescrever os valores. 

52. jOs primeiros quatro desvios em relação à média de 

uma amostra de n = 5 tempos de reação foram 0,3, 0,9, 
1,0 e 1,3. Qual é o quinto desvio em relação à média? 
Forneça uma amostra para a qual esses são os cinco 
desvios em relação à média. 

53. Reconsidere os dados sobre a área de lâmina escleral do 
Exercício 49. 

a. Deterrçiine os quartos inferior e superior. 
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b. Calcule o valor da dispersão entre os quartos. 

c. Se os dois maiores valores da amostra, 4,33 e 4,52, 
fossem 5,33 e 5,52, como / seria afetado? Explique. 

d. Em quanto a observação 2,34 pode ser aumentada 
sem afetar/? Explique. 

e. Se uma 18 a observação, jc 18 = 4,60, fosse adi- 
cionada à amostra, qual seria o valor de/? 

54. Reconsidere as observações de resistência ao cisalhamento 

(MPa) apresentadas no Exercício 34 deste capítulo: 

22,2 40,4. 16,4 73,7 36,6 109,9 

30,0 4,4 33,1 66,7 81,5 


a. Quais são os valores dos quartos e qual é o valor 
de/? 

b. Construa um boxplot com base no resumo de cinco 
valores e comente suas características. 

c. Quão grande ou pequena deve ser uma observação 
para se qualificar como um outlier ? E como um ou- 
tlier extremo? 

d. Em quanto a maior observação pode ser diminuída 
sem afetar /? 

55. Segue um diagrama de caule e folha dos dados de 
tempos de fuga apresentados no Exercício 36 des- 
te capítulo. 


32 

33 

34 

35 

36 

37 

38 

39 

40 

41 

42 


55 

49 

6699 

34469 

03345 

9 

2347 

23 

4 


a. Calcule o valor da dispersão entre os quartos. 

b. Há algum outlier na amostra? Algum outlier 
extremo? 

c. Construa um boxplot e comente suas características. 

d. Em quanto a maior observação, 424, pode ser di- 
minuída sem afetar o valor da dispersão entre 
os quartos? 

56. A quantidade de contaminação por alumínio (ppm) em 
certo tipo de plástico foi determinada para uma amostra 
de 26 espécimes de plástico, resultando nos dados a 
seguir (“The Lognormal Distribution for Modeling 
Quality Data when the Mean Is Near Zero,” J. of Qua - 
lity Technology, 1990, p. 105-1 10): 


30 

30 

60 

63 

70 

79 

87 

90 

101 

102 

115 

118 

119 

119 

120 

125 

140 

145 

172 

182 

183 

191 

222 

244 

291 

511 



Construa um boxplot que mostre outliers e comente 
suas características. 


57. Uma amostra de 20 garrafas de certo tipo de vidro foi 
selecionada e a resistência à pressão interna de cada 
garrafa foi determinada. Considere as seguintes infor- 
mações parciais da amostra: 

mediana = 202,2 quarto inferior = 196,0 
quarto superior = 216,8 

Três observações menores 1 25,8 188,1 1 93,7 

Três observações maiores 22 1 ,3 230,5 250,2 

a. Há algum outlier na amostra? Algum outlier 
extremo? 

b. Construa um boxplot que mostre outliers e comente 
suas características. 

58. Uma empresa usa duas máquinas diferentes para fabricar 
certo tipo de peça. Durante um turno, uma amostra de n 
= 20 peças produzidas por cada máquina é selecionada 
e o valor de uma importante dimensão de cada peça é de- 
terminado. O boxplot comparativo da figura a seguir foi 
construído a partir dos dados resultantes. Compare e 
destaque as diferenças entre as duas amostras. 

Boxplot comparativo do Exercício 58 

Máquina 



HZD — 


59. A concentração de cocaína no sangue (mg/L) foi deter- 
minada para uma amostra de indivíduos que morreram 
de delírio induzido por cocaína (ED) e para uma 
amostra de indivíduos que morreram de overdose de 
cocaína sem delírio. O tempo de sobrevida das pessoas 
em ambos os grupos foi de, no máximo, 6 horas. Os da- 
dos a seguir foram obtidos de um boxplot comparativo 
do artigo “Fatal Excited Delirium Following Cocaine 
Use” (J. of Forensic Sciences, 1997, p. 25-31). 

ED 0 0 0 0 0,1 0,1 0,1 0,1 0,2 0,2 0,3 0,3 
0,3 0,4 0,5 0,7 0,8 1,0 1,5 2,7 2,8 
3,5 4,0 8,9 9,2 11,7 21,0 

Não-ED 0 0 0 0 0 0,1 0,1 0,1 0,1 0,2 0,2 0,2 
0,3 0,3 0,3 0,4 0,5 0,5 0,6 0,8 0,9 1,0 

1.2 1,4 1,5 1,7 2,0 3,2 3,5 4,1 

4.3 4,8 5,0 5,6 5,9 6,0 6,4 7,9 

8.3 8,7 9,1 9,6 9,9 11,0 11,5 

12,2 12,7 14,0 16,6 17,8 

a. Determine as medianas, quartos e quartas dispersões 
das duas amostras. 

b. Há algum outlier nas amostras? Algum outlier 
extremo ? 



Visão Geral e Estatística Descritiva - Jay L. Devore 41 


c. Construa um boxplot comparativo e use-o como 
base para comparar e destacar as diferenças das 
amostras ED e não-ED. 

60. Foram obtidas observações sobre a resistência à ex- 
plosão (lb/in 2 ) de soldas de fechamento de bocais de 
teste e soldas de bocais de canísteres de produção 
(“Proper Procedures Are the Key to Welding Radioactive 
Waste Cannisters,” Welding J ., Aug. 1997, p. 61-67). 

Teste 7200 6100 7300 7300 8000 7400 
7300 7300 8000 6700 8300 
Caníster 5250 5625 5900 5900 5700 6050 
5800 6000 5875 6100 5850 6600 

Construa um boxplot comparativo e faça comentários so- 
bre os aspectos interessantes (o artigo citado não inclui a 
figura, mas os autores comentaram que ela foi vista). 

61. O seguinte boxplot comparativo sobre coeficientes de va- 
por de gasolina para veículos em Detroit foi exibido no 
artigo “Receptor Modeling Approach to VOC Emission 
Inventory Validation" (J. of Envir. Engr., 1995, p. 483- 
490). Comente as características interessantes. 


Boxplot comparativo do Exercício 61 

Coeficiente do vapor de gasolina 



Tempo 


Exercícios Suplementares (62-83) 

62. Considere as seguintes informações do limite de re- 
sistência à tração (lb/in) de uma amostra de n = 4 es- 
pécimes de fio rígido de cobre e zircônio (de “Charac- 
terization Methods for Fine Copper Wire" Wire J. Inti, 
ago., 1997, p. 74-80): 

x = 76831 s = 180 menor x. = 76683 
maior x. = 77048 

Determine os valores das duas observações da metade 
da amostra (e não o faça adivinhando!). 

63. Três valores diferentes de vazão C,F 6 (SCCM) foram 
consideradas em um experimento para investigar o 
efeito da vazão na uniformidade (%) da extremidade de 
um wafer de silício usado na fabricação de circuitos in- 
tegrados, resultando nos dados a seguir: 

Vazão 

125 2,6 2,7 3,0 3,2 3,8 4,6 

160 3,6 4,2 4,2 4,6 4,9 5,0 

200 2,9 3,4 3,5 4,1 4,6 5,1 

Compare e destaque as observações de uniformidade 
resultantes dessas diferentes vazões. 

64. A quantidade de radiação recebida em uma estufa tem 
importante papel na determinação da taxa de fotossín- 
tese. As observações a seguir sobre radiação solar 
foram lidas de um gráfico no artigo “Radiation Com- 
ponents over Bare and Planted Soils in a Greenhouse" 
(Solar Energy, 1990, p. 1011-1016). 


6,3 6,4 7,7 8,4 8,5 8,8 8,9 

9,0 9,1 10,0 10,1 10,2 10,6 10,6 

10,7 10,7 10,8 10,9 11,1 11,2 11,2 

11,4 11,9 11,9 12,2 13,1 

Use alguns dos métodos discutidos neste capítulo para 
descrever e resumir os dados. 

65. Os seguintes dados sobre emissões de HC e CO para 
um determinado veículo foram fornecidos na intro- 
dução do capítulo. 

HC (gtn/mi) 13,8 18,3 32,2 32,5 

CO (gm/mi) 118 149 232 236 

a. Calcule os desvios padrão amostrais das observações 
de HC e CO. A crença parece ter fundamento? 

b. O coeficiente de dispersão amostrai s/x (ou 100 
s/x) avalia o valor da dispersão em relação à média. 
Valores desses coeficientes de diversos conjun- 
tos de dados podem ser comparados para deter- 
minar quais conjuntos de dados exibem mais ou 
menos dispersão. Faça uma comparação dos da- 
dos fornecidos. 

66. A distribuição de freqüência a seguir, de observações 
sobre resistência à ruptura (MPa) de barras cerâmicas 
tratadas em um determinado forno, foi explicada no ar- 
tigo “Evaluating Tunnel Kiln Performance’' (Amer. Ce- 
ramic Soc. Buli , ago. 1997, p. 59-63). 
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Classe 

81- 

83- 

85- 

87- 

89- 


<83 

<85 

<87 

<89 

<91 

Freqüência 

6 

7 

17 

30 

43 

Classe 

91- 

93- 

95- 

97- 



<93 

<95 

<97 

<99 


Freqüência 

28 

22 

13 

3 



a. Construa um histograma com base nas freqüências 
relativas e comente as características interessantes. 

b. Que proporção das observações de resistência são 
iguais ou maiores que 85? Inferiores a 95? 

c. Grosso modo , que proporção das observações é in- 
ferior a 90? 

67. Quinze amostras de ar de certa região foram obtidas e 
para cada uma delas foi determinada a concentração de 
monóxido de carbono. Os resultados (em ppm) foram: 

9,3 10,7 8,5 9,6 12,2 15,6 9,2 10,5 

9,0 13,2 11,0 8,8 13,7 12,1 9,8 

Usando o método de interpolação sugerido na Seção 
1.3, calcule a média aparada 10%. 

68. a. Para que valor de c a quantidade X( x . — c) 2 é mini- 

mizada? (Dica: Obtenha a derivada em relação a c, 
iguale a 0 e resolva a equação), 
b. Usando o resultado da parte (a), qual das duas quan- 
tidades XOt. — x) 2 e 2(jc - / jl ) 2 será menor que a 
outra (assumindo que x i 1 jx )? 

69. a. Considere atb como constantes e y. = ax . + b para 

i = 1,2, ... , n. Quais são as relações entre x e y e en- 
tre s 2 e s 2 ? 

x y 

b. Uma amostra de temperaturas iniciais de uma deter- 
minada reação química resultou em uma média 
amostrai (°C) de 87,3 e um desvio padrão amostrai 
de 1,04. Quais são a média e o desvio padrão em °F? 
(Dica: F = f C + 32.) 

70. O elevado consumo de energia durante o exercício con- 
tinua após o fim do treino. Como as calorias queimadas 
após o exercício contribuem para a perda de peso e têm 
outras consequências, é importante entender esse pro- 
cesso. O estudo “Effect of Weight Training Exercise and 
Treadmill Exercise on Post-Exercise Oxygen Consump- 
tion” (Medicine and Science in Sports and Exercise , 
1998, p. 518-522) relatou os dados a seguir de um es- 
tudo em que o consumo de oxigênio (litros) foi medido 
continuamente por 30 minutos para cada um dos 15 in- 
divíduos após um exercício de levantamento de peso e 
após um exercício em esteira rolante. 


Indivíduo 1 

2 3 

4 

5 6 

7 

8 < 

) 

10 

11 12 

13 

14 15 




Levantamento (x) 

14,6 

14,4 

19,5 

24,3 

16,3 

22,1 

de peso 

23,0 

18,7 

19,0 

17,0 

19,1 

19,6 


23,2 

18,5 

15,9 




Esteira (y) 

11,3 

5,3 

9,1 

15,2 

10,1 

19,6 

rolante 

20,8 

10,3 

10,3 

2,6 

16,6 

22,4 


23,6 

12,6 

4,4 





a. Construa um boxplot comparativo das observações 
de levantamento de peso e de esteira rolante e co- 
mente as características encontradas. 

b. Como os dados estão na forma de pares (x, y), com 
as medidas x e y da mesma variável em duas con- 
dições diferentes, é natural enfocar as diferenças en- 
tre os pares: d { = x { — y ]t ..., d n = x n — y n . Construa 
um boxplot das diferenças das amostras. O que 
ele sugere? 

71. Segue uma descrição do MINITAB dos dados de re- 
sistência fornecidos no Exercício 13. 

Variável N Média Mediana Média Ap DesvPad Média SE 

resistência 153 135,39 135,40 135,41 4,59 0,37 

Variável Minimo Máximo Q1 Q3 

resistência 122,20 147,70 132,95 138,25 

a. Comente as características interessantes (os quartis 
e quartos são praticamente idênticos aqui). 

b. Construa um boxplot dos dados com base nos quar- 
tis e comente suas características. 

72. Distúrbios causados por ansiedade e seus sintomas nor- 
malmente podem ser tratados com medicamentos à 
base de benzodiazepina. É sabido que animais expostos 
a estresse apresentam redução da capacidade de ab- 
sorção de receptores de benzodiazepina no córtex 
frontal. O artigo “Decreased Benzodiazepine Receptor 
Binding in Prefrontal Córtex in Combat-Related Post- 
traumatic Stress Disorder” (Amer J. of Psychiatry \ 
2000, p. 1 120-1126) descreveu o primeiro estudo da re- 
dução da capacidade de absorção de receptores de ben- 
zodiazepina em indivíduos que sofriam de DSPT. Os 
dados a seguir, relacionados a uma medida da capaci- 
dade de absorção (distribuição ajustada do volume), 
foram tirados de um gráfico do artigo. 

DSPT: 10, 20, 25, 28, 31, 35, 37, 38, 38, 39, 39, 42, 46 

Saudável: 23, 39, 40, 41, 43, 47, 51, 58, 63, 66, 67, 

69, 72 

Use os diversos métodos deste capítulo para descrever 
e resumir os dados. 

73. O artigo “Can We Really Walk Straight?” (Amer. J. of 
Physical Anthropology, 1992, p. 19-27) relatou um ex- 
perimento em que cada um de 20 homens saudáveis foi 
solicitado a caminhar da forma mais reta possível até 
um alvo a 60m de distância com velocidade normal. 
Considere as observações a seguir sobre a cadência 
(número de passos por segundo): 

0,95 0,85 0,92 0,95 0,93 0,86 1,00 0,92 0,85 0,81 
0,78 0,93 0,93 1,05 0,93 1,06 1,06 0,96 0,81 0,96 

Use os métodos desenvolvidos neste capítulo para re- 
sumir os dados e inclua interpretações ou discussões, se 
apropriado. (Nota: O autor do artigo usou uma análise 
estatística sofisticada para concluir que as pessoas não 
podem andar em linha reta e sugeriu diversas expli- 
cações para isso.) 
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74. A moda de um conjunto de dados numéricos é o valor 
que ocorre mais freqüentemente no conjunto. 

a. Determine a moda dos dados de cadência fornecidos 
no Exercício 73. 

b. Para uma amostra categorizada, como você definiria 
a categoria modal? 

75. Foram selecionadas amostras de três tipos de corda e o 
limite de fadiga (MPa) foi determinado para cada 
amostra, resultando os dados a seguir. 

Tipo 1 350 350 350 358 370 370 370 371 

371 372 372 384 391 391 392 

Tipo 2 350 354 359 363 365 368 369 371 

373 374 376 380 383 388 392 

Tipo 3 350 361 362 364 364 365 366 371 

377 377 377 379 380 380 392 

a. Construa um boxplot comparativo e comente as 
semelhanças e diferenças. 

b. Construa um gráfico de pontos ( dotplot ) compara- 
tivo (um dotplot para cada amostra com uma escala 
comum). Comente as semelhanças e diferenças. 

c. O boxplot comparativo da parte (a) fornece uma 
avaliação informativa das semelhanças e diferenças? 
Explique seu raciocínio. 

76^ As três medidas de tendência central apresentadas neste 
capítulo são a média, a mediana e a média aparada. Duas 
medidas de tendência central adicionais, usadas ocasio- 
nalmente, são o centro da amplitude, que é a média entre 
a menor e a maior observações e a média dos quartos, que 
é a média dos dois quartos. Quais destas cinco medidas 
de tendência central são indiferentes aos efeitos de 
outliers e quais não são? Explique seu raciocínio. 

77. Considere os dados a seguir sobre tempo de conserto 
ativo (horas) para uma amostra de n = 46 rádios de co- 
municação aéreos: 

0,2 0,3 0,5 0,5 0,5 0,6 0,6 0,7 0,7 0,7 0,8 0,8 

0,8 1,0 1,0 1,0 1,0 1,1 1,3 1,5 1,5 1,5 1,5 2,0 

2.0 2,2 2,5 2,7 3,0 3,0 3,3 3,3 4,0 4,0 4,5 4,7 

5.0 5,4 5,4 7,0 7,5 8,8 9,0 10,3 22,0 24,5 

Construa: 

a. Um diagrama de caule e folha em que os dois maio- 
res valores são exibidos separadamente em uma 
linha denominada Hl; 

b. Um histograma com base em seis intervalos de clas- 
se com 0 como limite inferior do primeiro intervalo 
e as larguras de intervalo de 2, 2, 2, 4, 10 e 10, 
respectivamente. 

78. Considere uma amostra x,, x^ ... , x n e suponha que os 
valores de x, s 2 e s tenham sido calculados. 

a. Assuma y. = x, -x para i = 1, ... , n. Como os valo- 
res de s 2 e s dos y. se comparam aos valores corres- 
pondentes dos x? Explique. 


b. Assuma z j — (x — x)/s para i = 1, ... , n. Quais são 
os valores da variância amostrai e do desvio padrão 
amostrai dos z,? 

79, 1 Representemos por x n e s 2 n a média e a variância 
amostrai x n+l e 5; +1 ,as quantidades quando uma obser- 
vação adicional v +I é adicionada à amostra: 

a. Mostre como x^, pode ser calculado a partir de x 

e x J _ i . 

n+ 1 

b. Mostre que 

- (n ~ 1 *1 + U B+I - xf 
de forma que j* +| possa ser calculado a partir de 

c. Suponha que uma amostra de 15 fios de tapeçaria 
tenha uma média de alongamento de 1 2,58mm e um 
desvio padrão de 0.5 1 2mm. O 16“ fio resulta em um 
valor de alongamento de 1 1,8. Quais são os valores 
da média amostrai e do desvio padrão das 16 obser- 
vações de alongamento? 

80 . As distâncias das rotas de ônibus em qualquer sistema 
de trânsito normalmente variam de um trajeto para 
outro. O artigo “Planning of City Bus Routes” (J. ofthe 
Institution of Engineers, 1995, p. 21 1-215) fornece as 
informações a seguir sobre as distâncias (km) de um 
determinado sistema: 


Extensão 

6- 

8- 

10- 

12- 

14- 


<8 

<10 

<12 

<14 

<16 

Frequência 

6 

23 

30 

35 

32 

Extensão 

16- 

18- 

20- 

22- 

24- 


<18 

<20 

<22 

<24 

<26 

Frequência 

48 

42 

40 

28 

27 

Extensão 

26- 

28- 

30- 

35- 

40- 


<28 

<30 

<35 

<40 

<45 

Frequência 

26 

14 

27 

11 

2 


a. Desenhe um histograma correspondente a estas 
freqüências. 

b. Que proporção destas distâncias são inferiores a 20? 
Que proporção das rotas possui distância ao menos 
de 30? 

c. Grosso modo , qual é o valor do 90° percentil da dis- 
tribuição de distâncias de rotas? 

d. Grosso modo, qual é a mediana da distância de rota? 

81 . Um estudo realizado para investigar a distribuição do 
tempo total de frenagem (tempo de reação mais tempo 
do movimento entre acelerador e freio, em ms) em 
condições reais de dirigibilidade a 60km/h forneceu as 
informações resumidas sobre a distribuição dos tempos 
(“A Field Study on Braking Responses during Driving,” 
Ergonomics, 1995: 1903-1910): 

média = 535 mediana = 500 moda = 500 
dp = 96 mínimo = 220 máximo = 925 
5“ percentil = 400 10“ percentil = 430 

90“ percentil = 640 95“ percentil = 720 
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O que você pode concluir sobre o formato do his- 
tograma desses dados? Explique seu raciocínio. 

82. Os dados de amostra x v x v ... , x n algumas vezes repre- 
sentam uma série temporal, onde x ( = valor observado 
de uma variável de resposta x no momento t. Freqüen- 
temente, a série observada mostra grande variação 
aleatória, o que dificulta o estudo do comportamento de 
longo prazo. Nessas situações, é desejável produzir 
uma versão suavizada da série. Uma das técnicas usa- 
das é a suavização exponencial. O valor de uma con- 
stante de suavização a é escolhido (0 < a < 1). Então, 
com x f = valor ajustado no instante t, definimos x f = x { 
e para t = 2, 3, ... , n, x t = ax t + (1 - a)3c f _ r 

a. Considere a seguinte série de tempo em que x ( = tem- 
peratura (°F) de efluente em uma estação de trata- 
mento de esgoto no dia t: 47, 54, 53, 50, 46, 46, 47, 
50, 51, 50, 46, 52, 50, 50. Plote cada coordenada x t 
em relação a t em um sistema bidimensional (um grá- 
fico de série de tempo). Parece haver algum padrão? 

b. Calcule o x ( usando a = 0,1. Repita, para a = 0,5. 
Que valor de a fornece uma série x mais suavizada? 

c. Substitua Jt = ax t _ } + (1 - à)x t _ 2 no lado direito 
da expressão de x t e então substitua x f _ 2 em termos 
de x ( _ 2 , x e assim por diante. De quantos valores 
x e ..., jc r x t depende? O que acontece ao coefi- 
ciente de x k quando k aumenta? 

d. Consulte a parte (c). Se t for grande, qual é a sensi- 
bilidade de x t em relação ao valor inicial x t = x ] ? 
Explique. 

(Nota: Uma referência relevante é o artigo “Simple Sta- 
tistics for Interpreting Environmental Data,” Water Pol- 
lution Control Fed. J., 1981, p. 167-175.) 


83. Considere as observações numéricas ..., x n Freqüen- 
temente é de interesse saber se os x. estão (ao menos 
aproximadamente) distribuídos simetricamente ao re- 
dor de algum valor. Se n é pelo menos moderadamente 
grande, a extensão da simetria pode ser avaliada por 
meio de um diagrama de caule e folha ou de um his- 
tograma. Entretanto, se n não for muito grande, esses 
gráficos não serão muito informativos. Considere a al- 
ternativa a seguir: seja y, o menor x., y 2 o segundo 
menor x. e assim por diante. Faça então o gráfico dos 
seguintes pares como pontos em um sistema de coor- 
denadas bidimensional: (y n —x,x - y,), (y n _, —x,x — y 2 ), 
(y n 2 — Jc, Jc — y 3 ), ... Há n/2 pontos em que n é par e 
(n - l)/2 em que n é ímpar. 

a. Qual é a aparência do gráfico quando há simetria 
perfeita dos dados? Qual sua aparência quando as 
observações se estendem mais acima do que abaixo 
da mediana (uma cauda superior longa)? 

b. Os dados a seguir sobre precipitação (acre-pé) de 
26 nuvens esparsas foram obtidos do artigo “A 
Bayesian Analysis of a Multiplicative Treatment 
Effect in Weather Modification” (Technometrics, 
1975, p. 161-166). Construa o gráfico e comente 
sobre a extensão da simetria ou a natureza do 
seu desvio. 


4,1 

7,7 

17,5 

31,4 

32,7 

40,6 

92,4 

115,3 

118,3 

119,0 

129,6 

198,6 

200,7 

242,5 

255,0 

274,7 

274,7 

302,8 

334,1 

430,0 

489,1 

703,4 

978,0 

1656,0 

1697,8 

2745,6 
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2 

Probabilidade 


Introdução 

0 termo probabilidade se refere ao estudo da aleatoriedade e da incerteza. 

Em qualquer situação em que ocorrem diversos resultados, a teoria da probabilidade 
oferece métodos de quantificação das chances ou possibilidades de ocorrência associadas 
aos diversos resultados. A linguagem da probabilidade é constantemente usada de 
maneira informal em contextos escritos e falados. Exemplos incluem declarações como: "é 
provável que a média Dow-Jones cresça no final do ano", "há 50% de chance de o titular 
buscar a reeleição", "provavelmente pelo menos uma seção deste curso será oferecida no 
ano que vem", "as chances favorecem um acordo rápido para o fim da greve" e "espera-se 
que pelo menos 20 mil ingressos sejam vendidos para o show". Neste capítulo, apre- 
sentaremos alguns conceitos básicos de probabilidade, indicaremos como as probabili- 
dades podem ser interpretadas e como suas regras podem ser aplicadas para calcular as 
possibilidades de ocorrência de muitos eventos. A metodologia da probabilidade permitirá 
que expressemos, em linguagem precisa, declarações informais como as fornecidas acima. 

O estudo da probabilidade como ramo da matemática data de mais de 300 anos e 
teve sua gênese relacionada a questões que envolviam jogos de azar. Muitos livros se 
dedicam exclusivamente à probabilidade, mas nosso objetivo é cobrir apenas a parte da 
disciplina que tem maior ligação com os problemas de inferência estatística. 


2.1 


Espaços amostrais e eventos 


Um experimento é qualquer ação ou processo cujo resultado está sujeito à incerteza. Apesar de o termo experi- 
mento geralmente sugerir uma situação altamente controlada de teste em laboratório, aqui será usado em um sen- 
tido muito mais amplo. Dessa forma, os experimentos que são de interesse incluem jogar uma moeda uma ou 
diversas vezes, selecionar uma ou várias cartas de um baralho, pesar um pedaço de pão, determinar o tempo de 
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viagem de casa ao trabalho em uma dada manhã, obter tipos sangüíneos de um grupo de indivíduos ou medir as 
resistências de compressão de diversas vigas metálicas. 

O espaço amostrai de um experimento 


DEFINIÇÃO 


O espaço amostrai de um experimento, representado por S, é o conjunto de todos os re- 
sultados possíveis desse experimento. 


Exemplo 2.1 

O experimento mais simples a que a probabilidade se aplica é aquele com dois resultados finais possíveis. Um 
exemplo de experimento desse tipo é examinar um único fusível para ver se funciona. O espaço amostrai desse 
experimento é expresso como S= {N, D], onde A' representa sem defeito, D representa com defeito e as chaves 
são usadas para englobar os elementos do conjunto. Outro experimento desse tipo envolve jogar um percevejo e 
observar se sua ponta cai para cima ou para baixo, com o espaço amostrai S— {C, B] e um terceiro consiste em 
observar o sexo da próxima criança nascida no hospital local, com S — {M, F). 

Exemplo 2.2 

Se examinarmos três fusíveis em seqüência e anotarmos o resultado de cada exame, o resultado do experimento 
é qualquer seqüência de N e D de 3 elementos, de forma que 

S= {NNN, NND, NDN, ND D, DNN, DND, DDN, DDD) 

Se tivéssemos jogado um percevejo três vezes, o espaço amostrai seria obtido substituindo N por C no 
S acima, e com uma alteração similar na notação do espaço amostrai para o experimento em que o sexo de três 
crianças recém-nascidas é observado. ■ 

Exemplo 2.3 

Dois postos de gasolina estão localizados em uma determinada interseção. Cada um possui seis bombas. Con- 
sidere o experimento em que o número de bombas em uso em determinada hora do dia é determinado para cada 
posto. Um resultado experimental especifica quantas bombas estão em uso no primeiro postò e quantas são usa- 
das no segundo. Um resultado possível é (2, 2), outro é (4, 1) e outro ainda é (1, 4). Os 49 resultados em S são 
exibidos na tabela a seguir. O espaço amostrai do experimento em que um dado de seis lados é lançado duas 
vezes é obtido excluindo a linha 0 e a coluna 0 da tabela, fornecendo 36 resultados. 


Segundo Posto 




0 

1 

2 

3 

4 

5 

6 


0 

(0. 0) 

(0,1) 

(0, 2) 

(0, 3) 

(0, 4) 

(0,5) 

(0, 6) 


1 

(1.0) 

(1.1) 

(1.2) 

(1.3) 

(1,4) 

(1,5) 

(1,6) 


2 

(2,0) 

(2, 1) 

(2, 2) 

(2, 3) 

(2, 4) 

(2, 5) 

(2, 6) 

Primeiro posto 

3 

(3, 0) 

(3, 1) 

(3, 2) 

(3, 3) 

(3, 4) 

(3, 5) 

(3, 6) 


4 

(4,0) 

(4, 1) 

(4, 2) 

(4, 3) 

(4, 4) 

(4, 5) 

(4, 6) 


5 

(5, 0) 

(5.1) 

(5, 2) 

(5,3) 

(5, 4) 

(5, 5) 

(5, 6) 


6 

(6,0) 

(6, 1) 

(6, 2) 

(6, 3) 

(6, 4) 

(6, 5) 

(6, 6) 
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Exemplo 2.4 

Se uma bateria de lanterna nova, tipo D, tiver uma voltagem fora de certos limites, será classificada como falha 
(F); se a voltagem estiver dentro dos limites especificados, será classificada como sucesso (S). Suponha que um 
experimento consista em testar cada bateria quando sai de uma linha de montagem até que seja observado um 
sucesso. Apesar de não ser muito provável, um resultado possível é que as primeiras 10 (ou 100 ou 1000 ou ...) 
sejam Fe a próxima seja S. Isto é, para qualquer inteiro n possível, teremos de examinar n baterias antes de obter 
o primeiro S. O espaço amostrai é S— [S, FS, FFS, FFFS, ...}, que contém um número infinito de resultados 
possíveis. A mesma forma abreviada de espaço amostrai é apropriada para um experimento em que, é registrado 
o sexo de cada criança recém-nascida, em um horário especificado, até que seja observado o nascimento de uma 
criança do sexo masculino. ■ 

Eventos 

No estudo de probabilidade, estaremos interessados não apenas nos resultados individuais de <f, como também 
em qualquer grupo de resultados de S. 


DEFINIÇÃO 


Evento é qualquer grupo (subconjunto) de resultados contidos no espaço amostrai 
S. O evento é denominando simples se consistir um único resultado e composto se consis- 
tir em mais de um resultado. 


Quando um experimento é realizado, determinado evento A ocorre se o resultado experimental estiver con- 
tido em A. Em geral, ocorrerá exatamente um evento simples, mas diversos eventos compostos também podem 
ocorrer simultaneamente. 

Exemplo 2.5 

Considere um experimento em que cada um de três veículos que trafeguem em uma determinada estrada siga 
pela saída à esquerda (E) ou à direita (D) no final da rampa de saída. Os oito resultados possíveis que compõem 
o espaço amostrai são: EEE, DEE, EDE, EED, EDD, DED, DDE e DDD. Dessa forma, há oito eventos simples, 
dentre os quais estão F, = [EEE] e E, = [EDD). Os eventos compostos incluem: 

A = { DEE, EDE, EED } = o evento em que exatamente um dos três veículos vira à direita; 

B = {EEE, DEE, EDE, EED } = o evento em que no máximo um dos veículos vira à direita; 

C = [EEE, DDD) = o evento em que os três veículos viram na mesma direção. 

Suponha que, quando o experimento é executado, o resultado seja EEE. Então, o evento simples E, terá 
ocorrido, da mesma forma que os eventos B e C (mas não A). ■ 

Exemplo 2.6 (continuação do Exemplo 2.3) 

Quando o número de bombas em uso em cada um dos dois postos de seis bombas for observado, haverá 49 
resultados possíveis, de forma que haverá 49 eventos simples: E, = {(0, 0)}, E 2 = ((0, 1)}, ... , E 49 = {(6, 6)}. 
Exemplos de eventos compostos são 

A = ((0, 0), (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} = o evento em que o número de bombas em uso é o 
mesmo nos dois postos; 

B = {(0, 4), (1, 3), (2, 2), (3, 1), (4, 0)} = o evento em que o número total de bombas em uso é quatro; 

C = {(0, 0), (0, 1), (1, 0), (1, 1)} = o evento em que no máximo uma bomba está em uso em 
cada posto. ■ 
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Exemplo 2.7 (continuação do Exemplo 2.4) 

O espaço amostrai do experimento de exame das baterias contém um número infinito de resultados, portanto há 
um número infinito de eventos simples. Os eventos compostos incluem: 

A = {5, FS, FFS } = o evento em que no máximo três baterias são examinadas; 

E = { FS , FFFS , FFFFFS , ... } = o evento em que um número par de baterias é examinado. ■ 

Algumas relações sobre a teoria dos conjuntos 

Um evento é essencialmente um conjunto, de forma que as relações e resultados da teoria elementar dos con- 
juntos podem ser usados para o estudo dos eventos. As operações a seguir serão usadas para construção 
de novos eventos, a partir de eventos conhecidos. 


DEFINIÇÃO 


1. A união de dois eventos Aefi, representada por A U B e lida “A união B'\ é o evento 
que consiste em todos os resultados que estão no evento A ou no B ou em ambos (de 
forma que a união inclui resultados em que ocorram Az B, bem como aqueles em que 
exatamente um ocorre), isto é, todos os resultados em ao menos um dos eventos. 

2. A interseção dos dois eventos AzB, representada por A D B e lida “A interseção B", 
é o evento que consiste de todos os resultados que estão em ambos A e B. 

3. O complemento de um evento A, representado por A', é o conjunto de todos os resul- 
tados em S que não estão contidos em A. 


Exemplo 2.8 (continuação do Exemplo 2.3) 

Para o experimento em que é observado o número de bombas em uso em um posto de gasolina de seis bombas, 
assuma A = {0, 1, 2, 3, 4), B = (3, 4, 5, 6} e C = { 1, 3, 5}. Então 

A U B = {0, 1, 2, 3, 4, 5, 6} = <?; A U C = (0, 1, 2, 3, 4, 5}, 

A íl 8 = (3, 4), Afl C = {1, 3}, A' = {5,6}, {A U C}' = (6) 

Exemplo 2.9 (continuação do Exemplo 2.4) 

No experimento da bateria, defina A, B e C por 

A = [S, FS, FFS } 

B - {5, FFS, FFFFS ) 
e 

C = {FS, FFFS, FFFFFS, ...} 

Então 

A U B = {5, FS, FFS, FFFFS] 

ADB= [S, FFS] 

A’ = { FFFS, FFFFS, FFFFFS, ...} 
e 

C = {5, FFS, FFFFS, ... } = (evento em que é inspecionado um número ímpar de baterias) ■ 

Algumas vezes, Aefi não possuem resultados em comum, de modo que a interseção d z Az B não contém 
nenhum resultado. 
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DEFINIÇÃO 


Quando A e B não possuem resultados em comum, são chamados eventos mutuamente 

exclusivos ou disjuntos. 


Exemplo 2.10 

Uma cidade pequena possui três revendedores de automóveis: um revendedor GM que vende Chevrolets. Pon- 
tiacs e Buicks, um revendedor Ford que vende Fords e Mercurys e um revendedor Chrysler que vende Plymouths 
e Chryslers. Se um experimento consistir em observar a marca do próximo carro vendido, os eventos A = 
{Chevrolet, Pontiac, Buick) e B = {Ford, Mercury) são mutuamente exclusivos porque o próximo carro ven- 
dido não pode ser um produto GM e Ford ao mesmo tempo. ■ 

As operações de união e interseção podem ser estendidas a mais de dois eventos. Para quaisquer três even- 
tos A, B e C, o evento A U B U C é o conjunto de resultados contidos em no mínimo um dos três eventos, 
enquanto A D B fl C é o conjunto de resultados contidos nos três eventos. Dados os eventos A„ A z , A„ ... , eles 
serão denominados mutuamente exclusivos (ou disjuntos em pares) se dois deles não tiverem resultados 
em comum. 

Uma representação gráfica de eventos e manipulações de eventos é obtida pelo uso de diagramas de Venn. 
Para construir um desses diagramas, desenhe um retângulo cujo interior representará o espaço amostrai S. En- 
tão, qualquer evento A é representado como o interior de uma curva fechada (normalmente um círculo) contido 
em S. A Figura 2.1 mostra exemplos de diagramas de Venn. 


'GD e 

s 

'OD s 

s 

' 30 " 

s 

SE 1 

'O O' 

S 


(a) Diagrama de Venn 
dos eventos A e B 


(b) Região sombreada 

a n b 


(c) Região sombreada 
A U B 


(d) Região sombreada 
A' 


Figura 2.1 Diagramas de Venn 


(e) Eventos mutuamente 
exclusivos 


Exercícios Seção 2.1 <1-10) 


1. Quatro universidades — 1 , 2, 3 e 4 — estão participando 
de um torneio de basquete. Na primeira etapa , 1 jogará 
com 2 e 3 com 4. Os dois vencedores disputarão o 
campeonato e os dois perdedores também jogarão. Um 
resultado possível pode ser representado por 1324 (1 
ganha de 2 e 3 ganha de 4 nos jogos da primeira etapa 
e 1 ganha de 3 e 2 ganha de 4). 

a. Relacione todos os resultados de S. 

b. Represente por A o evento em que 1 ganha o torneio. 
Relacione os resultados de A. 

c. Represente por B o evento em que 2 seja um dos fi- 
nalistas do campeonato. Relacione os resultados de B. 

d. Quais são os resultados de A U B e de A H B? Quais 
são os resultados de A'l 


2. Suponha que os veículos que trafegam em uma deter- 
minada estrada possam tomar uma saída à direita (D), à 
esquerda (E) ou ir em frente (F). Observe a direção de 
cada um de três veículos sucessivamente, 

a. Relacione todos os resultados do evento A em que os 
três veículos seguem na mesma direção. 


b. Relacione todos os resultados do evento B em que os 
três veículos tomam diferentes direções. 

c. Relacione os resultados do evento C em que exata- 
mente dois dos três veículos viram à direita. 

d. Relacione todos os resultados do evento D em que 
exatamente dois veículos seguem na mesma direção. 

e. Relacione os resultados em D\ C U D, e C fl D. 

3. Três componentes estão conectados para formar um sis- 
tema conforme exibido no diagrama a seguir. Como os 
componentes no subsistema 2-3 estão conectados em 
paralelo, esse subsistema funcionará se ao menos um 
dos dois componentes individuais funcionar. Para que 
todo o sistema funcione, o componente 1 deve fun- 
cionar, bem como o subsistema 2-3. 
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O experimento consiste em determinar a condição de 
cada componente [S (sucesso) para um componente que 
funciona bem e F (falha) para um componente que 
não funciona]. 

a. Que resultados estão contidos no evento A para que 
exatamente dois dos três componentes funcionem? 

b. Que resultados estão contidos no evento B para que 
ao menos dois componentes funcionem? 

c. Que resultados estão contidos no evento C para que 
o sistema funcione? 

d. Relacione os resultados de C\ A U C, A H C, B U 
CefiflC. 

4. Cada item de uma amostra de quatro hipotecas esta 
classificado como taxa fixa (F) ou taxa variável (VO- 

a. Quais são os 16 resultados de SI 

b. Que resultados do evento possuem exatamente três 
hipotecas de taxa fixa? 

c. Que resultados do evento possuçm quatro hipotecas 
de taxa fixa? 

d. Que resultados pertencem ao evento em que as qua- 
tro hipotecas são de taxa variável? 

e. Qual é a união dos eventos das partes (c) e (d) e qual 
a interseção desses dois eventos? 

f. Quais são a união e a interseção dos dois eventos das 
partes (b) e (c)? 

5. Uma família de três pessoas -A, B e C- tem plano de uma 
clínica médica que sempre possui um médico em cada 
posto 1, 2, e 3. Durante determinada semana, cada mem- 
bro da família visita a clínica uma vez e é designada aleato- 
riamente a um posto. O experimento consiste em registrar 
o número do posto para cada membro. Um resultado é (1, 
2, 1) para A no posto 1, B no posto 2 e C no posto 1. 

a. Relacione os 27 resultados do espaço amostrai. 

b. Relacione todos os resultados do evento em que os 
três membros seguem para o mesmo posto. 

c. Relacione todos os resultados do evento em que to- 
dos os membros seguem para postos diferentes. 

d. Relacione todos os resultados do evento em que 
ninguém segue para o posto 2. 

6. A biblioteca de uma faculdade possui cinco exemplares 
de certo livro-texto de reserva. Duas cópias (1 e 2) são 
primeiras edições e as outras três (3, 4 e 5) são segundas 
edições. Um aluno examina esses livros em ordem alea- 
tória, parando apenas quando uma segunda edição é sele- 
cionada. Um resultado possível é 5 e outro é 213. 

a. Relacione todos os resultados de S. 


b. Represente por A o evento em que exatamente um 
livro deve ser examinado. Quais são os resultados 
em Al 

c. Represente por B o evento em que o livro 5 é o sele- 
cionado. Quais resultados pertencem a BI 

d. Represente por C o evento em que o livro 1 não é 
examinado. Quais resultados pertencem a Cl 

7. Um departamento acadêmico terminou a votação se- 
creta para sua chefia. A uma contém quatro cédulas 
com votos para o candidato A e três com votos para o 
candidato B. Suponha que essas cédulas sejam remo- 
vidas da urna uma a uma. 

a. Relacione todos os resultados possíveis. 

b. Suponha que uma contagem seja feita conforme as 
cédulas são removidas. Para que resultados A se 
mantém na frente de B na contagem? 

8. Uma empresa de engenharia civil está trabalhando 
atualmente em usinas de energia em três locais dife- 
rentes. Represente por A, o evento em que a usina no lo- 
cal / é completada na data do contrato. Use as operações 
de união, interseção e complemento para descrever 
cada um dos eventos a seguir nos termos de A,, A 2 e A 3 , 
desenhe um diagrama de Venn e sombreie a região cor- 
respondente a cada uma. 

a. Ao menos uma usina é concluída até a data do 
contrato. 

b. Todas as usinas são concluídas até a data do con- 
trato. 

c. Apenas a usina do local 1 é concluída até a data 
do contrato. 

d. Exatamente uma usina é concluída até a data do 
contrato. 

e. Apenas a usina do local 1 ou as duas outras são con- 
cluídas até a data do contrato. 

9. Use diagramas de Venn para provar as duas relações a 
seguir para eventos A e B (denominadas leis de De 
Morgan) para quaisquer eventos AtB: 

a. (AUfl)'=A'n£' 

b. (A H B)' = A’ U B' 

10. a. No Exemplo 2.10, identifique três eventos que não 
são mutuamente exclusivos, 
b. Suponha que não haja um resultado comum a todos 
os três eventos A, B e C. Esses eventos são necessa- 
riamente mutuamente exclusivos? Se sua resposta 
for sim, explique. Se for não, dê um exemplo con- 
trário, usando o experimento do Exemplo 2.10. 


2.2 


Axiomas, Interpretações e Propriedades da 
Probabilidade 


Dados um experimento e um espaço amostrai S> o objetivo da probabilidade é atribuir a cada evento A 
um número P(A), denominado probabilidade do evento A, que fornecerá uma medida precisa da chance de 


Probabilidade - Jay L. Devore 51 


ocorrência de A. Para assegurar que as atribuições de probabilidade sejam consistentes com nossas noções 
intuitivas de probabilidade, todas as atribuições devem satisfazer os axiomas a seguir (propriedades básicas) 
de probabilidade. 


AXIOMA 1 
AXIOMA 2 
AXIOMA 3 


Para qualquer evento, A, P(A) > 0. 

/>(<?)= 1 . 

a. Se A,, A 2 , . . . , A k for um conjunto finito de eventos mutuamente exclusivos, então 
P(A, U A 2 U • • • U A k ) = 2 P(A ( ) 

i=i 

b. Se A,, A 2 , A 3 , ... for um conjunto infinito de eventos mutuamente exclusivos, então 

P(A, U A 2 U A 3 U • • • ) = í P(A,) 

i-i 


O Axioma 1 reflete a noção intuitiva de que a chance de ocorrência de A deve ser não-negativa. O espaço 
amostrai é, por definição, o evento que deve ocorrer quando o experimento é realizado («f contém todos os re- 
sultados possíveis), de forma que o Axioma 2 diz que a maior probabilidade possível de ser atribuída a <?é 1.0 
terceiro axioma formaliza a idéia de que, se desejarmos que a probabilidade de ao menos um de diversos even- 
tos ocorra e que dois eventos não ocorram simultaneamente, a chance de pelo menos um ocorrer será a soma das 
chances dos eventos individuais. 

Exemplo 2.11 

No experimento em que uma única moeda é lançada, o espaço amostrai é S = {H, T). Os axiomas especificam 
que P(S) = 1, de forma que, para completar a atribuição de probabilidade, falta apenas determinar P(H) e P(T). 
Já que H e T são eventos disjuntos eWU^Ío Axioma 3 implica que 

1 = P(<f) = P(H) + P(T) 

Essa expressão implica que P(T) = 1 - P(H). A única liberdade permitida pelos axiomas nesses experi- 
mentos é a probabilidade atribuída a H. Uma possível atribuição de probabilidades é P(H) = 0,5, P(T) = 0,5, 
enquanto outra atribuição possível é P(H) = 0,75, P(T) = 0,25. De fato, representar p por qualquer número fixo 
entre 0 e 1, P(H) = pe P(T) = 1 —pé uma atribuição consistente com os axiomas. ■ 

Exemplo 2.12 

Considere o experimento do Exemplo 2.4, em que as baterias que saem de uma linha de montagem são testadas 
uma a uma até que seja encontrada uma com voltagem dentro dos limites especificados. Esses eventos simples 
são E | = {5}, E 2 = [FS }, E y = (FFS), E A = { FFFS }, ... Suponha que a probabilidade de uma bateria ser sa- 
tisfatória seja de 0,99. Então, pode ser demonstrado que P(£,) = 0,99, P(E 2 ) = (0,01)(0,99), P(E 3 ) = 
(0,01 ) 2 (0,99)... é uma atribuição de probabilidades a eventos simples que satisfazem os axiomas. Em particular, 
porque os E, são disjuntos e S = E, U £ 2 U £, U . . . , deve ser o caso de que 

1 = P(f) = />(£,) + P(£ 2 ) + P(E 3 ) + • • • 

= 0,99[1 + 0,01 + (0,01) 2 + (0,01) 3 + • • •] 

A validade dessa igualdade é uma conseqüência de um resultado matemático referente à soma de uma série 
geométrica. 

Entretanto, outra atribuição de probabilidade legítima (de acordo com os axiomas) do mesmo tipo 
“geométrico” é obtida pela substituição de 0,99 por qualquer número p entre 0 e 1 e 0,01 por (1 - p). ■ 
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Interpretando probabilidade 

Os Exemplos 2.1 1 e 2.12 mostram que os axiomas não determinam completamente uma atribuição de probabi- 
lidades a eventos. Os axiomas servem apenas para cortar atribuições inconsistentes com as noções intuitivas de 
probabilidade. No experimento de lançamento de uma moeda do Exemplo 2.11, duas atribuições particulares 
foram sugeridas. A atribuição correta ou apropriada depende da forma pela qual o experimento é executado e 
também da interpretação da probabilidade. A interpretação usada com mais freqüência e mais compreendida 
baseia-se na noção de freqüências relativas. 

Considere um experimento que pode ser executado repetidamente de uma forma idêntica e independente e 
represente por A um evento que consista de um conjunto fixo de resultados do experimento. Exemplos simples 
de experimentos passíveis de repetição incluem o lançamento de dados e moedas discutidos anteriormente. Se o 
experimento for executado n vezes, em algumas delas o evento A ocorrerá (o resultado será o conjunto A) e em 
outras, não. Represente por n(A) o número de repetições em que A ocorre. A relação n(A)/n é denominada fre- 
qüência relativa de ocorrência do evento A na seqüência de n repetições. Evidências empíricas, com base nos 
resultados de várias dessas seqüências de experimentos repetidos, indicam que, conforme n aumenta, a freqüência 
relativa n(A)/n se estabiliza, de acordo com ilustração da Figura 2.2. Isto é, conforme n toma-se arbitrariamente 
grande, a freqüência reativa se aproxima de um valor-limite denominado freqüência relativa-limite do evento A. 
A interpretação objetiva da probabilidade identifica essa freqüência relativa-limite com P(A). 


i 


X 


n(A) _ Freqüência 
n relativa 


0 


x 


x 


x x x XXX 


n 

1 2 3 ••• 100 101 102 

n = Número de experimentos realizados 

Figura 2.2 Estabilização da freqüência relativa 


Se forem atribuídas probabilidades a eventos de acordo com suas freqüências relativas-limite, podemos in- 
terpretar a afirmativa “a probabilidade de dar ‘cara’ em um lançamento de moeda é de 0,5” para indicar que, em 
grande número de lançamentos, a “cara” será exibida em cerca de metade deles e “coroa”, na outra metade. 

A interpretação de freqüência relativa da probabilidade é tida como objetiva porque toma como base uma 
propriedade do experimento, em vez de qualquer indivíduo preocupado com o experimento. Por exemplo: dois 
observadores de uma seqüência de lançamentos de moeda devem usar as mesmas atribuições de probabili- 
dade, já que eles não influenciam a freqüência relativa-limite. Na prática, essa interpretação não é tão obje- 
tiva quanto parece, já que a freqüência relativa-limite de um evento não será conhecida. Portanto, temos de 
atribuir probabilidades com base em nossa crença sobre a freqüência relativa-limite dos eventos em estudo. 
Felizmente, há muitos experimentos para os quais há consenso no que diz respeito a atribuições de probabi- 
lidade. Quando falamos de uma moeda justa, queremos dizer que P(H) — P(T) = 0,5; e um dado justo é 
aquele em que as freqüências relativas-limite dos seis resultados são todas 5 , sugerindo atribuições de proba- 
bilidade P({ 1 }) = ••• = P({ 6 }> = i 

Como a interpretação objetiva da probabilidade se baseia na noção de freqüência-limite, sua aplicabilidade 
é limitada a situações experimentais que podem ser repetidas. Ainda assim, a linguagem de probabilidade é nor- 
malmente usada em relação a situações que não podem ser repetidas. Os exemplos incluem: “há boas chances 
de um acordo de paz”, “provavelmente nossa empresa fechará o contrato” e “como o melhor atacante deles está 
machucado, espero que eles não marquem mais de 10 contra nós”. Nessas situações, desejamos, como antes, 
atribuir probabilidades numéricas a diversos resultados e eventos (por exemplo: a probabilidade de fecharmos 
0 contrato é de 0,9). Devemos, portanto, adotar uma interpretação alternativa dessas probabilidades. Como 
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diferentes observadores podem ter diversas informações prévias e opiniões a respeito de situações experimen- 
tais, as atribuições de probabilidade podem ser diferentes de indivíduo para indivíduo. As interpretações nestas 
situações são denominadas subjetivas. O livro de Robert Winkler relacionado nas referências do capítulo fornece 
uma boa pesquisa sobre diversas interpretações subjetivas. 

Propriedades de probabilidade 


PROPOSIÇÃO 


Para qualquer evento, A, P(A) = 1 — P(A'). 


Demonstração 

No Axioma 3a, assuma k = 2, A, = A, e A : = A'. Já que por definição A', A U A' = S enquanto A e A' são 
disjuntos, 1 = P(<?) = P(A U A') = P(A) + P(A'), de onde segue o resultado. ■ 

Essa proposição é surpreendentemente útil, porque há várias situações em que P(A') é mais facilmente 
obtido pelos métodos diretos do que P(A). 

Exemplo 2.13 

Considere um sistema de cinco componentes idênticos ligados em série, conforme ilustrado na Figura 2.3. 



Figura 2.3 Um sistema de cinco componentes ligados em série 


Represente um componente que falha por Fe o que não falha por S (de sucesso). Represente por A o evento 
em que o sistema falha. Para que A ocorra, ao menos um dos componentes individuais deve falhar. Os resultados 
de A incluem SSFSS ( 1 , 2, 4 e 5 funcionam, mas 3 não), FFSSS e assim por diante. Na verdade há 3 1 diferentes 
resultados em A. Entretanto, A', o evento em que o sistema funciona, consiste em um único resultado SSSSS. Na 
Seção 2.5 veremos que se 90% de todos esses componentes não apresentarem falhas e se componentes diferentes 
apresentarem falhas independentemente um do outro, P(A') = P(SSSSS) = 0,9 5 = 0,59. Portanto, P(A) = 1 -0,59 
= 0,41. Dessa forma, em um grande número de tais sistemas, cerca de 41% apresentarão falhas. ■ 

Em geral, a proposição acima é útil quando o evento de interesse pode ser expresso como “ao menos...”, já 
que o complemento “menos que...” pode ser mais fácil de se lidar (em alguns problemas, “mais que...” é mais 
fácil de lidar que “no máximo...”). Se você tiver dificuldade para calcular P(A) diretamente, pense em determi- 
nar P(A'). 


PROPOSIÇÃO 


S t At B forem mutuamente exclusivos, então P(A D B) = 0. 


Demonstração 

Visto que A fl B não contém resultados, (A fl B)' = S. Portanto, l = P[(A fl B )'] = 1 — P(A D B), o que 
implica P(A fl B) = 1 — 1 = 0. ■ 

Quando os eventos A e B são mutuamente exclusivos, o Axioma 3 fornece P(A U B) = P(A) + P(B). 
Quando A e B não são mutuamente exclusivos, a probabilidade da união é obtida do resultado a seguir. 

Para quaisquer dois eventos A e B, 

P(A UB) = P(A) + P(B) - P(A n B) 


PROPOSIÇÃO 
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Observe que a proposição é válida mesmo seáefl forem mutuamente exclusivos, já que P(A D B) = 0. A 
idéia central é que, ao adicionar P(A) e P(B), a probabilidade da interseção A fl B será contada duas vezes, de 
forma que P(A fl B) deve ser subtraído. 

Demonstração 

Observe primeiro que AU8 = AU(Bn A'), conforme ilustrado na Figura 2.4. Visto que Ae(BD A') 
são mutuamente exclusivos, P(A U B) = P(A) + P(B fl A'). Mas B = (B fl 4) U (B fl A') (a união da parte 
de B contida emAea parte de B não contida em A), sendo (B D 4) e (B fl A') mutuamente exclusivos, de 
forma que P(B) = P(B fl A) + P(B fl A'). Combinando esses resultados, temos 

P{A U B) = P(A ) + P(B fl A') = P(A) + (P(B) - P(A O B)] 

= P(A) + P(B) - P(A Cl B) 


A m‘ 

= 

«0 

u 

G* 


Figura 2.4 


Representação de 4 u fl como união de eventos disjuntos 


Exemplo 2.14 

Em um determinado bairro residencial, 60% de todos os lares assinam o jornal metropolitano publicado em uma 
cidade próxima, 80% assinam o jornal local e 50% de todos os lares assinam os dois. Se um lar for selecionado 
aleatoriamente, qual será a probabilidade de ele assinar (1) ao menos um dos jornais e (2) exatamente um dos 
dois jornais? 

Fazendo A = (assinaturas do jornal metropolitano} e B = (assinaturas do jornal local}, as informações 
fornecidas implicam P(A ) = 0,6, P(B) = 0,8, e P(A fl B) = 0,5. A proposição anterior se aplica a dar 

P( assinaturas de ao menos um dos jornais) 

= P(A U B) = P(A) + P(B) - P(A DB) = 0,6 + 0,8 - 0,5 = 0,9 

O evento de um lar assinar apenas o jornal local pode ser escrito como A' fl B [(não-metropolitano) e lo- 
cal]. A Figura 2.4 implica que 

0,9 = P(A U B) = P(A) + P(A' 0 B) = 0,6 + P(A' H B) 

pela qual P(A' fl B) = 0,3. De forma similar, P{A H B') = P(A UB) - P(B) = 0,1. Como ilustrado na Figura 
2.5, onde se vê que 


P( exatamente um) = P(A fl B') + P(A' fl B) = 0,1 + 0,3 = 0,4 

i 



Figura 2.5 


Probabilidades do Exemplo 2.14 


A probabilidade de uma união de mais de dois eventos pode ser calculada de forma análoga. Para os três 
eventos A, B e C, o resultado é 

P(A U B U C) = P(A) + P(B) + P(C) - P(A H B) - P(A fl C) 

- P(B n o + P(A n s n o 
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Como vemos no diagrama de Venn de A U B U C, exibido na Figura 2.6, quando P(A), P(B) e P(C) são 
adicionados, certas interseções são contadas duas vezes, de forma que devem ser subtraídas, mas isso resulta em 
P(A ílfiflC) sendo subtraída mais de uma vez. 


Determinando as sistemáticas de probabilidades 

Quando o número de resultados possíveis (eventos simples) é grande, haverá muitos eventos compostos. Uma 
forma simples de determinar as probabilidades desses eventos, que evita a violação dos axiomas e as pro- 
priedades derivadas, é primeiro determinar as probabilidades P(E,) para todos os eventos simples. Isso deve sa- 
tisfazer P(E,) > 0 e Ziodo» , £(£,) = 1. Dessa forma, a probabilidade de qualquer evento composto A é calculada 
pela adição das P(E,) para todos os E, em A: 


Represente os seis eventos básicos { 1 (6) associados ao lançamento de um dado de seis lados uma vez por 
Ei,... E 6 . Se o dado for construído de tal forma que qualquer um dos três resultados pares tenha o dobro de pro- 
babilidade de ocorrer em relação aos ímpares, uma atribuição apropriada de probabilidades a eventos ele- 


mentares é P(E,) = £(£,) = P(E f ) = P(E 2 ) = £(£,) = P(E 6 ) = f. Dessa forma, para o evento A = {resultado 

par) = £, U £ 4 U £,„ P(A) — P(E 2 ) + P(E A ) + P{E b ) = f = f ; para B = (resultado ^ 3 } = E, U £ 2 U £„ P(B) = 


eventos simples. Tais eventos incluem exemplos óbvios, como lançamento de uma moeda; ou um dado não vi- 
ciado uma ou duas vezes (ou qualquer número fixo de vezes); ou selecionar uma ou diversas cartas de um ba- 
ralho de 52 cartas bem embaralhado. Com p = P(E,) para cada i, 


Isto é, se houver N resultados possíveis, a probabilidade atribuída a cada um será 1/AÍ. Consideremos um 
evento A, com N(A) representando o número de resultados contidos em A. Então 


quer evento, devemos contar os resultados nele contidos e obter a razão entre os dois números. Dessa forma, 
quando os resultados forem igualmente prováveis, o cálculo das probabilidades se resume na contagem. 



Figura 2.6 A U B U C 


P(A) = 2 />(£,) 


todos os E, em A 


Exemplo 2.15 



Resultados igualmente prováveis 

Em muitos experimentos que consistem em N resultados, é razoável atribuir probabilidades iguais a todos os N 


N 


N 


1 =2P(£,)= Zp = p-N 


então p = — 


i=i 


£/ em A £, em A N N 

Depois de contarmos o número N de resultados no espaço amostrai para calcular a probabilidade de qual- 


P(A) = 2 P(E.) = I Tr = ^ 
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Exemplo 2.16 

Quando dois dados são lançados separadamente, há N = 36 resultados (excluir as primeiras linha e coluna da 
tabela no Exemplo 2.3). Se os dois dados forem justos, todos os 36 resultados serão igualmente prováveis, en- 
tão P(E,) = Dessa forma, o evento A = {soma dos dois números = 7} consistirá em seis resultados (1,6), 
(2, 5), (3, 4), (4, 3), (5, 2) e (6, 1). Assim, 


P(A) = 


N(A) = _6_ 
N 36 


J_ 

6 


Exercícios Seção 2.2 (1 1-28) 

11. Uma empresa de fundos mútuos oferece a seus clientes 
diversos fundos: um de mercado, três de títulos dife- 
rentes, (curto, médio e longo prazos), dois fundos de 
ações (moderado e de alto risco) e um misto. Dentre os 
usuários que possuem cotas em apenas um fundo, se- 
guem as porcentagens de clientes nos diferentes fundos. 

Mercado 20% Ações de alto risco 

Título curto prazo 15% Ação de risco 

Título moderado 

intermediário 10% Misto 

Título longo prazo 5% 


25% 

7% 



13 . 


Um cliente que possui cotas em apenas um fundo é se- 
lecionado aleatoriamente. 

a. Qual é a probabilidade de o indivíduo selecionado 
possuir cotas do fundo misto? 

b. Qual é a probabilidade de o indivíduo selecionado 
possuir cotas em um fundo de títulos? 

c. Qual é a probabilidade de o indivíduo selecionado 
não possuir cotas em um fundo de ações? 

Selecione aleatoriamente um estudante em uma deter- 
minada universidade e represente por A o evento de ele 
possuir um cartão de crédito Visa e por B o evento aná- 
logo para um MasterCard. Suponha que P(A) = 0,5, 
P(B) = 0,4 e P(A H B) = 0,25. 

a. Calcule a probabilidade de que o indivíduo sele- 
cionado tenha pelo menos um dos dois tipos de 
cartão (ou seja, a probabilidade do evento A U B). 

b. Qual é a probabilidade de o indivíduo selecionado 
não ter nenhum dos tipos de cartão? 

c. Descreva, em termos de A e B, o evento em que o es- 
tudante selecionado possui um cartão Visa, mas não 
um MasterCard. Calcule a probabilidade desse evento. 

Uma empresa de consultoria em informática apresenta 
suas propostas de três projetos. Represente por A t = 
{projeto i fechado}, para i = 1, 2, 3 e suponha que 
P(A,) = 0,22, P(A 2 ) = 0,25, P(A 3 ) = 0,28, P(A, n 

a 2 ) = 0,1 1, m, n a 3 ) = 0,05, p(a 2 n a 3 ) = 0,07, 

P(A, H A 2 O A y ) = 0,01. Expresse em palavras cada 
evento a seguir e calcule sua probabilidade: 

a. A, U A 2 f ’■* 

b. A\ n A' 2 [Sugestão: (A, U A 2 )' = A\ D A 2 ] 


c. A, U A 2 UAj 

d. a; n a' 2 n a.; 

e. a; n A 2 n a, 

f. (a; nAí)UA, 

4. Uma empresa de eletricidade oferece uma taxa vitalícia 
de energia a qualquer lar cuja utilização de energia es- 
teja abaixo de 240 kWh durante um determinado mês. 
Represente por A o evento de um lar selecionado alea- 
toriamente em uma comunidade que não excede a uti- 
lização da taxa vitalícia em janeiro e por B o evento 
análogo para o mês de julho (A e B se referem ao 
mesmo lar). Suponha que P(A) = 0,8, P(B) = 0,7 e 
P(A U B) = 0,9. Calcule: 

a. P(A H B). 

b. A probabilidade de a quantia da taxa vitalícia ser ex- 
cedida em exatamente um dos dois meses. Descreva 
esse evento em termos de A e B. 

15. Considere o tipo de secadora de roupas (a gás ou elétri- 
cas) comprada por cinco clientes diferentes em uma loja. 

a. Se a probabilidade de no máximo um desses clientes 
fazer uma compra de uma secadora elétrica for 
0,428, qual será a probabilidade de ao menos dois 
clientes comprarem uma secadora elétrica? 

b. Se Píos cinco comprarem a gás) = 0,116 e P(os 
cinco comprarem elétricas) = 0,005, qual será a 
probabilidade de haver uma compra de ao menos 
uma de cada tipo? 

Um indivíduo recebe três copos de refrigerante diferen- 
tes rotulados de C, D e P Solicita-se que ele experi- 
mente os três e os relacione em ordem de preferência. 
Suponha que o mesmo refrigerante tenha sido colocado 
nos três copos. 

a. Quais são os eventos simples nesse experimento de 
classificação e qual probabilidade você atribuiria a 
cada um deles? 

b. Qual é a probabilidade de C ser classificado como 
o primeiro? 

c. Qual é a probabilidade de C ser classificado como o 
primeiro e D como o último? 

17. Represente por A o evento de que a próxima solicitação 
de assistência de um consultor de um software estatís- 
tico seja relacionada ao pacote SPSS e por B o evento 
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de a próxima solicitação de ajuda ser relacionada ao pa- 
cote SAS. Suponha que P(A ) — 0.30 e P(B) = 0,50. 

a. Por que não é o caso de P(A) + P(B) = 1? 

b. Calcule P(A'). 

c. Calcule P(A U B). 

\ d. Calcule P(A' 0 B’). 

^TUma caixa contém -quatra lâmpadas de 40- W, cinco de 
60- W e seia. de 75-W. Se as lâmpadas forem sele- 
cionadas uma a uma em ordem aleatória, qual é a pro- 
babilidade de ao menos duas serem selecionadas para 
obter uma de 75 W? 

19. A inspeção visual de juntas de solda em placas de cir- 
cuitos impressos pode ser bastante subjetiva. Parte do 
problema se origina dos diversos tipos de defeitos de 
soldas (por exemplo, falta solda em pontos variados) e 
até da quantidade de um ou mais desses defeitos. Con- 
seqüentemente, até mesmo inspetores altamente treina- 
dos podem discordar sobre a disposição de uma junta. 
Em um lote de 10.000 juntas, o inspetor A encontrou 
724 que julgou defeituosas, o inspetor B encontrou 751 
e 1159 foram encontradas por ao menos um dos ins- 
petores. Suponha que uma dessas 10.000 juntas seja se- 
lecionada aleatoriamente. 

a. Qual é a probabilidade de que a junta seleciona- 
da não seja julgada defeituosa por nenhum dos dois 
inspetores? 

b. Qual é a probabilidade de que a junta selecionada 
seja julgada defeituosa pelo inspetor B % mas não pelo 
inspetor A? 

20. Uma determinada fábrica opera em três turnos dife- 
rentes. No ano anterior, ocorreram 200 acidentes na 
fábrica. Alguns deles podem ser atribuídos em parte a 
condições de trabalho inseguras, enquanto os outros 
não estão relacionados a condições de trabalho. A tabe- 
la a seguir fornece as porcentagens de acidentes que se 
encaixam em cada categoria de turno de trabalho. 

Condições Não relacionado 

Inseguras às condições 


Dia 

10% 

35% 

Türno Alternado 

8% 

20% 

Noite 

5% 

22% 


Suponha que um dos 200 relatórios de acidente seja se- 
lecionado aleatoriamente de um arquivo de relatórios e 
sejam determinados o tipo de acidente e o turno. 

a. Quais são os eventos simples? 

b. Qual é a probabilidade de que o acidente selecio- 
nado seja atribuído a condições inseguras? 

c. Qual é a probabilidade de que o acidente seleciona- 
do não tenha ocorrido no turno do dia ? 

21. Uma empresa de seguros oferece quatro níveis de de- 
dução - nenhum, baixo, médio e alto - para os possui- 
dores de apólices de seguros residenciais e três níveis 
diferentes - baixo, médio e alto - para os possuidores 
de apólices de seguros de automóveis. A tabela a seguir 


fornece as proporções das diversas categorias de segu- 
rados que possuem ambos os tipos de seguros. Por 
exemplo: a proporção de indivíduos com baixa dedução 
de seguro residencial e baixa dedução de seguro de au- 
tomóvel é 0,06 (6% de todos os indivíduos). 


Residencial 


Automóvel 

N 

B 

M 

A 

B 

0,04 

0,06 

0,05 

0,03 

M 

0,07 

0,10 

0,20 

0,10 

A 

0,02 

0,03 

0,15 

0,15 


Suponha que um indivíduo que possua ambos os tipos 

de apólices seja selecionado aleatoriamente. 

a. Qual é a probabilidade de que o indivíduo tenha de- 
dução média de automóvel e alta de residência? 

b. Qual é a probabilidade de que o indivíduo tenha uma 
dedução baixa de automóvel? Uma dedução baixa 
de residência? 

c. Qual é a probabilidade de que um indivíduo esteja 
na mesma categoria para deduções de automóvel 
e residência? 

d. Com base na resposta da parte (c), qual é a probabi- 
lidade de que as duas categorias sejam diferentes? 

e. Qual é a probabilidade de que o indivíduo tenha ao 
menos um nível baixo de dedução? 

f. Usando a resposta da parte (e), qual é a probabili- 
dade de que nenhum nível de dedução seja baixo? 


IL A rota usada por um motorista que vai ao trabalho con- 
tém dois cruzamentos com semáforos. A probabilidade 
de que ele tenha de parar no primeiro semáforo é 0,4, a 
probabilidade análoga para o segundo semáforo é 0,5 e 
a probabilidade de que ele tenha de parar em pelo 
menos um dos dois semáforos é 0,6. Qual é a probabi- 
lidade de ele ter de parar: 

a. Nos dois semáforos? 

b. No primeiro semáforo mas não no segundo? 

c. Em exatamente um semáforo? 


Os computadores de seis membros do corpo docente de 
um determinado departamento serão substituídos. Dois 
deles escolheram laptops e os outros quatro desktops. 
Suponha que ( apenas duas configm ações]podem ser fei- 
tas em um determinado dia e que os dois computadores 
a serem configurados sejam selecionados aleatoriamente 
entre os seis (implicando 15 resultados igualmente pro- 
váveis se os computadores estiverem numerados 1, 2, 
..., 6, de forma que um resultado consistirá nos com- 
putadores 1 e 2, outro nos computadores 1 e 3 e assim 
por diante). 

a. Qual é a probabilidade de que as duas configurações 
selecionadas sejam de laptopsl 

b. Qual é a probabilidade de que as configurações sele- 
cionadas sejam de desktopsl 

c. Qual. é a probabilidade de que ao menos uma das 
configurações selecionadas seja de um computa- 
dor desktopl 
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d. Qual é a probabilidade de que ao menos um com- 
putador de cada tipo seja escolhido para a confi- 
guração? 

24. Use os axiomas para mostrar que, se um evento A es- 
tiver contido em outro evento B (ou seja, A é um sub- 
conjunto de B), então P(A) < P(B). [ Sugestão : neste 
caso, A e £, A e B H A' são disjuntos e B = A U (B Pl 
A '), como pode ser visto em um diagrama de Venn.] 
Para os A e B genéricos, o que podemos deduzir sobre 
as relações P(A fl £), P(A), e P(A U £)? 

Í5y Os três principais itens opcionais de certo tipo de carro 
\ novo são transmissão automática ( A ), teto solar (B) e rá- 
dio com CD-player (C). Se 70% de todos os com- 
pradores solicitarem A, 80% solicitarem B, 75% solici- 
tarem C, 85% solicitarem A ou B, 90% solicitarem A ou 
C, 95% solicitarem B ou Ce 98% solicitarem A ou B ou 
C, calcule as probabilidades dos eventos a seguir. [Su- 
gestão: “A ou ZT é o evento em que no mínimo dois 
opcionais são solicitados.] Desenhe um diagrama de 
Venn e identifique todas as regiões. 

a. O comprador seguinte solicita um dos três opcionais. 

b. O comprador seguinte não solicita nenhum opcional. 

c. O comprador seguinte solicita apenas transmissão 
automática^ nenhum dos outros dois opcionais. 

d. O comprador seguinte solicita exatamente um 
opcional. 

26. Um determinado sistema pode ter três tipos diferen- 
tes de defeitos. Represente por A, (i = 1, 2, 3) o evento 
em que o sistema apresenta um defeito do tipo /. 
Suponha que 

P(A\) = 0,12 P(A 2 ) = 0,07 P(A 3 ) = 0,05 
P(A, U A 2 ) = 0,13 P(A ] U A 3 ) = 0,14 

p ( a 2 u a 3 ) = 0,10 P(A, n a 2 n a 3 ) = 0,01 

a. Qual é a probabilidade de o sistema não ter um de- 
feito do tipo 1 ? 


b. Qual é a probabilidade de o sistema ter defeitos dos 
tipos 1 e 2? 

c. Qual é a probabilidade de o sistema ter defeitos dos 
tipos 1 e 2, mas não do tipo 3? 

d. Qual é a probabilidade de o sistema ter no máximo 
dois desses defeitos? 

27. Um departamento acadêmico com cinco membros do 
corpo docente — Anderson, Box, Cox, Cramer e Fisher 
— deve selecionar dois deles para servir a um comitê de 
avaliação de pessoal. Como o trabalho levará muito 
tempo, ninguém deseja servir, de forma que foi decidido 
que os representantes serão selecionados por sorteio, 
colocando-se cinco tiras de papel em uma caixa, mistu- 
rando-as e selecionando duas. 

a. Qual é a probabilidade de Anderson e Box serem 
selecionados? ( Sugestão : Relacione os resultados 
igualmente prováveis.) 

b. Qual é a probabilidade de que pelo menos um dos 
dois membros cujos nomes sejam iniciados por C 
seja selecionado? 

c. Se os cinco membros tiverem 3, 6, 7, 10 e 14 anos de 
ensino na universidade, respectivamente, qual é a 
probabilidade de que os dois representantes escolhi- 
dos tenham no mínimo 1 5 anos de ensino na univer- 
sidade (tempos de ensino somados)? 

28. No Exercício 5, suponha que qualquer indivíduo tenha 
possibilidade igualmente provável de ser designado 
para qualquer um dos três postos independentemente de 
para onde os outros sejam designados. Qual é a possi- 
bilidade de: 

a. Os três membros da família serem enviados ao 
mesmo posto? 

b. No máximo dois membros da família serem envia- 
dos ao mesmo posto? 

c. Cada membro da família ser enviado a um pos- 
to diferente? 


2.3 


Técnicas de contagem 


Quando os diversos resultados de um experimento são igualmente prováveis (a mesma probabilidade é atribuída 
a cada evento simples), a tarefa de calcular probabilidades se reduz a uma contagem. Em particular, se N for a 
quantidade de resultados de um espaço amostrai e N(A) for a quantidade de resultados contidos em um evento 
A, então 


P(A) = (2.1) 

N 

Se uma lista dos resultados estiver disponível ou for de fácil construção, e N for pequeno, então o numerador e 
o denominador da Equação (2.1) podem ser obtidos sem o uso de quaisquer princípios de contagem geral. 

Há, entretanto, muitos experimentos para os quais o esforço despendido na elaboração de tal lista 
é proibitivo porque N é muito grande. Explorando algumas regras gerais de contagem, é possível calcular 
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probabilidades da forma (2.1) sem relacionar os resultados. Essas regras também são úteis em vários problemas 
que envolvem resultados que não sejam igualmente prováveis. Várias das regras desenvolvidas aqui serão usadas 
no estudo das distribuições de probabilidades no próximo capítulo. 

A regra do produto para pares ordenados 

Nossa primeira regra se aplica a qualquer situação em que um conjunto (evento) consiste em pares ordenados 
de objetos e desejamos contar o número desses pares. Entendemos por par ordenado que, se O, e 0 2 forem 
objetos, o par (<?,, 0 2 ) será diferente do par ( 0 2 , O,). Por exemplo: se um indivíduo seleciona uma linha 
aérea para uma viagem de Los Angeles a Chicago e (após fazer negócios em Chicago) uma segunda linha para 
seguir até Nova York, uma possibilidade é (American, United), outra é (United, American) e outra, 
(United, United). 


PROPOSIÇÃO 


) 


Se o primeiro elemento ou objeto de um par ordenado puder ser selecionado de n, formas 
e para cada uma dessas n , formas, o segundo elemento do par pode ser selecionado de n 2 
formas, o que faz com que o número de pares seja n,n 2 . 


Exemplo 2.17 

O proprietário de uma casa em reforma solicita os serviços de um encanador e de um eletricista. Se houver 12 
empreiteiros de encanamento e 9 empreiteiros eletricistas disponíveis na área, de quantas formas os empreiteiros 
podem ser contratados? Se representarmos os encanadores por P, ... P, 2 e os eletricistas por Q { ... Q 9 , desejamos 
que os pares sejam da forma (P,, Q). Com n, = 12 e n 2 = 9, a regra do produto fornece N = (12)(9) = 108 for- 
mas possíveis de escolher dois tipos de empreiteiros. ■ 

No Exemplo 2.17, a escolha do segundo elemento do par não depende de o primeiro ter sido escolhido ou 
ter ocorrido. Enquanto houver o mesmo número de escolhas do segundo elemento para cada primeiro, a regra 
do produto será válida, mesmo quando o conjunto de segundos elementos possíveis depender do primeiro. 

Exemplo 2.18 

Uma família se mudou para uma cidade e precisa dos serviços de um obstetra e de um pediatra. Há duas clíni- 
cas de fácil acesso e cada uma tem dois obstetras e três pediatras. A família obterá benefícios máximos de se- 
guro de saúde se escolher uma clínica e selecionar os dois especialistas. De quantas formas isso pode ser feito? 
Represente os obstetras por 0„ 0 2 , 0„ e 0 4 e os pediatras por P„ ... P 6 . Desejamos então determinar o número 
de pares ( 0„ P,) para os quais O, e P, estão associados à mesma clínica. Como há quatro obstetras, n, = 4 e 
para cada um há três escolhas de pediatra, n 2 = 3, a aplicação da regra do produto fornece N = n,n 2 = 12 
escolhas possíveis. ■ 

Diagramas de árvore 

Em diversos problemas de contagem e probabilidade, uma configuração denominada diagrama de árvore pode 
ser usada para representar graficamente todas as possibilidades. O diagrama de árvore associado ao Exemplo 
2.18 é exibido na Figura 2.7. Partindo de um ponto do lado esquerdo do diagrama, para cada primeiro elemento 
possível de um par origina-se um segmento de reta direcionado para a direita. Cada uma dessas retas é denomi- 
nada ramo de primeira geração. Para cada ramo de primeira geração criamos outro segmento de reta originando- 
se na extremidade do ramo, para cada escolha possível do segundo elemento do par. Cada segmento de reta é um 
ramo de segunda geração. Como há quatro obstetras, há quatro ramos de primeira geração e três pediatras para 
cada obstetra resultam em três ramos de segunda geração, originando-se de cada ramo de primeira geração. 
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Figura 2.7 Diagrama de árvore do Exemplo 2.18 


Suponha que, genericamente, haja n x ramos de primeira geração e para cada um deles haja n 2 ramos de se- 
gunda geração. O número total de ramos de segunda geração será então n x n 2 . Já que a extremidade de cada ramo 
de segunda geração corresponde a exatamente um par possível (escolher um primeiro elemento e então um se- 
gundo nos coloca exatamente na extremidade de um ramo de segunda geração), há pares n x n 2 , o que comprova 
a regra do produto. 

A construção de um diagrama de árvore não depende de ter o mesmo número de ramos de segunda geração 
originando-se de cada ramo de primeira geração. Se a segunda clínica tivesse quatro pediatras, haveria apenas 
três ramos partindo de dois dos ramos de primeira geração e quatro partindo de cada um dos dois outros ramos 
de primeira geração. Um diagrama de árvore pode então ser usado para representar graficamente experimentos 
diferentes daqueles a que se aplica a regra do produto. 

Uma regra do produto mais abrangente 

Se um dado de seis lados é lançado cinco vezes consecutivas em vez de apenas duas, cada resultado possível é 
um conjunto de cinco números como (1,3, 1, 2, 4) ou (6, 5, 2, 2, 2). Denominaremos um conjunto ordenado de 
k objetos uma k-tupla (assim um par é uma 2-tupla e um trio é uma 3-tupla). Cada resultado de experimento 
de lançamento de dados é uma 5-tupla. 


Regra do produto para /c-tuplas 

Suponha que um conjunto consista em conjuntos ordenados de k elementos (fc-tuplas) 
e que haja n, escolhas possíveis para o primeiro elemento. Para cada escolha do 
primeiro elemento, há n 2 escolhas possíveis do segundo elemento . . . ; para cada es- 
colha possível dos primeiros k — 1 elemento, há n k escolhas do elemento. Então há 
n x n 2 n k resultados possíveis £-tuplas. 


Essa regra mais geral também pode ser ilustrada por um diagrama de árvore. Apenas construa um diagrama 
mais elaborado, adicionando ramos de terceira geração partindo de cada extremidade de um ramo de segunda 
geração e assim por diante, até que os ramos de geração sejam adicionados. 

Exemplo 2.19 (continuação do Exemplo 2.17) 

Suponha que o trabalho de reforma da casa envolva a compra de diversos utensílios de cozinha. Eles serão com- 
prados do mesmo fornecedor e há cinco deles disponíveis na área. Com os fornecedores representados por D,, 
..., D 5 , há N = n x n 2 n^ = (5)(12)(9) = 540 3-tuplas da forma (D„ />, Q k \ havendo 540 formas de escolher pri- 
meiro um fornecedor de eletrodomésticos, depois um encanador e por fim um eletricista. ■ 
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Exemplo 2.20 (continuação do Exemplo 2.18) 

Se cada clínica tiver três especialistas em medicina interna e dois cirurgiões gerais, haverá n,n^t^i k = 
(4)(3)(3)(2) = 72 formas de selecionar um médico de cada tipo, de maneira que todos os médicos sejam da 
mesma clínica. ■ 


Arranjos e Permutações 

Até agora foram selecionados os elementos sucessivos de uma A-tupla a partir de conjuntos totalmente diferentes 
(por exemplo: fornecedores de utensílios de cozinha, encanadores e eletricistas). Em diversos lançamentos de 
um dado, o conjunto a partir do qual os elementos sucessivos são escolhidos é sempre { 1, 2, 3, 4. 5, 6}, mas as 
escolhas são feitas “com reposição”, de forma que o mesmo elemento pode aparecer mais de uma vez. Conside- 
remos um conjunto determinado que consiste em n elementos diferentes e suponhamos que um £-tupla seja for- 
mado pela seleção sucessiva a partir do conjunto sem reposição, de modo que um elemento possa aparecer uma 
única vez nas k posições possíveis. 


DEFINIÇÃO 


Qualquer sequência ordenada de k objetos selecionados de um conjunto de n objetos dis- 
tintos é denominada arranjo de tamanho k dos objetos. O número de arranjos de tamanho 
k que pode ser criado a partir dos n objetos é representado por A kn . 


O número de arranjos de tamanho k é obtido imediatamente pela regra geral do produto. O primeiro ele- 
mento pode ser escolhido de n formas diversas; para cada uma das n formas, o segundo elemento pode ser 
escolhido de n — 1 formas e assim por diante. Finalmente, para cada forma de seleção dos primeiros k — 1 ele- 
mentos, o fc-ésimo elemento pode ser escolhido de n — (k — 1) = n — k + 1 formas. Então 

A kn = n(n — 1)(« — 2) (n — k + 2)(n — k + 1) 


Exemplo 2.21 

Há 10 assistentes de professores disponíveis para correção de provas em um determinado curso. O primeiro exa- 
me consiste em quatro questões e o professor deseja selecionar um assistente diferente para corrigir cada uma 
(apenas um assistente por questão). De quantas formas diferentes os assistentes podem ser escolhidos para a cor- 
reção? Aqui, n = número de assistentes = 10 e k = número de questões = 4. O número de atribuições diferentes 
de correção então será A a l0 = (10)(9)(8)(7) = 5040. ■ 

A utilização da notação fatorial permite que A kn seja expresso de forma mais compacta. 


DEFINIÇÃO 


Para qualquer inteiro positivo m, m! é lido “fatorial de m” e definido por 
m\ = m(m — 1) (2)( 1 ). Além disso, 0! = 1. 


Usando a notação fatorial. (10)(9)(8)(7) = (10)(9)(8)(7)(6!)/6! = 101/6!. De forma mais geral, 
A*.„ = «(«-!) (n - k + 1) 


n(n - 1) (n - k + l)(n - *)(n - * - 1) (2)(1) 

(n-k)(n-k - 1) (2)(1) 

que se transforma em 


Por exemplo: A xg - 9!/(9 — 3)! = 9!/6! = 9 • 8 • 7 • 6!/6! = 9 • 8 • 7. Observe também que, como 0! = 1, 
0! = 1, P nn = n\/(n — n)! = n\! 0! = n!/l = nl, conforme mencionado. 


62 Probabilidade e Estatística - Editora Thomson 


Combinações 

Há muitos problemas de contagem em que é fornecido um conjunto de n objetos distintos e se deseja contar o 
número de subconjuntos não-ordenados de tamanho k. Por exemplo: no bridge importam apenas as 13 cartas da 
mão e não a ordem em que elas são dadas. Na formação de um comitê, a ordem em que os membros são rela- 
cionados normalmente não tem importância. 


DEFINIÇÃO 


Dado um conjunto de n objetos diferentes, qualquer subconjunto não-ordenado de 
tamanho k é denominado combinação. O número de combinações de tamanho k que po- 
dem ser formadas a partir de n objetos distintos é representado por 0. (Essa notação é 
mais comum na probabilidade do que C k „ que seria análogo à notação de permutações.) 


O número de combinações de tamanho k de um determinado conjunto é menor que o número de arranjos 
porque, quando a ordem não importa, diversos arranjos correspondem à mesma combinação. Considere, por 
exemplo, o conjunto (A. B, C, D, E], consistindo em cinco elementos. Há 5!/(5 - 3)! = 60 arranjos de tamanho 
3. Há seis arranjos de tamanho 3 que consistem nos elementos A, B e C, já que esses três elementos podem ser 
ordenados de 3 • 2 • 1 = 3! = 6 formas: (A, B, C), (A, C, B), (B, A, C), (B, C, A), (C, A, B) e (C, B. A). Esses seis 
arranjos são equivalentes a uma única combinação {A, fl.C). De forma similar, para qualquer outra combinação 
de tamanho 3, há 3! arranjos a cada uma obtida pela ordenação dos três objetos. Dessa forma, 

60 = A 3J = ^ j • 3!; então ( 3 ) = fr = 10 

Essas dez combinações são 

(A, B, C) {A. B, D) {A, B, E) {A, C, D) {A, C, E } {A, D, E). {B, C, D ) 

[B, C, E) {B, D, E) { C , D, £} 

Quando há n objetos diferentes, qualquer arranjo de tamanho k é obtido pela ordenação dos k objetos não- 
ordenados de uma combinação em uma de k! formas, de modo que a quantidade de arranjos seja o produto de 
k! e do número de combinações. Isso fornece 

/n\ 'ii = "! 

U / k\ k\(n - *)! 

Observe que (") = 1 e Q = 1, já que há apenas uma forma de escolhermos um conjunto de (todos) n ele- 
mentos ou de nenhum elemento, e (") = n, já que há n subconjuntos de tamanho 1 . 

Exemplo 2.22 

Uma mão de bridge consiste em quaisquer 13 cartas selecionadas de um baralho de 52 cartas sem importar a 
ordem. Há (”) = 52!/13!39! diferentes mãos de bridge , o que dá cerca de 635 bilhões. Como há 13 cartas em 
cada naipe, o número de mãos formadas unicamente por paus e/ou espadas (sem cartas vermelhas) é 0 ) = 
261/13! 13! = 10,400,600. Uma dessas (“) mãos é formada totalmente por espadas e outra por paus, de forma 
que há [(“) — 2] mãos formadas totalmente por espadas e paus na mão. Suponha que uma mão de bridge seja 
dada de um baralho bem embaralhado (ou seja, 13 cartas selecionadas aleatoriamente entre as 52 possibilidades) 
e seja 

A = {a mão formada inteiramente por espadas e paus com os dois naipes) 

B = {a mão formada por exatamente dois naipes). 
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Os N = (^) resultados possíveis são igualmente prováveis, de forma que 


2 

P{A) = ^ = • — = 0,0000164 

N 



= 0,0000164 


Como há $ = 6 combinações formadas por dois naipes, das quais espadas e paus são tal combinação, 


CH 

Q 


= 0,0000983 


Ou seja, uma mão totalmente formada por cartas de exatamente dois dos quatro naipes ocorre cerca de uma 
vez a cada 10.000. Se você joga bridge apenas uma vez por mês, é provável que nunca receba uma dessas mãos. ■ 


Um armazém de universidade recebeu uma entrega de 25 impressoras, das quais 10 são impressoras a laser e 15 
são a jato de tinta. Se 6 das 25 forem selecionadas aleatoriamente para serem verificadas por um técnico, qual 
será a probabilidade de que exatamente 3 delas sejam a laser (sendo as outras 3 a jato de tinta)? 

Represente por D 3 = {exatamente 3 das 6 selecionadas são impressoras a jato de tinta). Assumindo que 
qualquer conjunto específico de 6 impressoras tem a mesma chance de ser escolhido em relação a qualquer outro 
conjunto de 6, temos resultados igualmente prováveis, de forma que P(D,) = N(D y )/N, onde N é o número de 
formas de escolha das 6 impressoras dentre as 25 e N(D } ) é o número de formas de seleção de 3 impressoras a 
laser e 3 a jato de tinta. Assim, N = (”). Para obter N(D 3 ), pense em primeiro escolher 3 dos 15 modelos a jato 
de tinta e então 3 impressoras a laser. Há ( 3 ) formas de escolha de 3 modelos a jato de tinta e ('“) formas de es- 
colha de 3 impressoras a laser. Nesse caso, Af(D 3 ) é o produto desses dois números (visualize um diagrama de 
árvore - estamos realmente usando a regra do produto), de forma que 


Represente por D 4 = {exatamente 4 das 6 impressoras selecionadas são modelos a jato de tinta) e defi- 
na D 5 e Df, de forma análoga. Então a probabilidade de ao menos 3 impressoras a jato de tinta serem 
selecionadas é 


Exemplo 2.23 



3112! ’ 3!7! 
25! 


15! 10! 


6 ! 1 9 ! 


= 0,3083 


P(D, UD 4 U D s U D 6 ) = P(D,) + P(D 4 ) + P(D S ) + P{D b ) 
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Exercícios 


Seção 2.3 (29-44) 


b. 


c. 


C\ 

2% O conselho de estudantes de engenharia de certa facul- 
dade possui um aluno representante de cada uma das 
áreas de engenharia (civil, elétrica, produção de mate- 
riais e mecânica). De quantas formas é possível: 

a. Selecionar um presidente e um vice-presidente? 

b. Selecionar um presidente, um vice-presidente e 
um secretário? 

c. Selecionar dois membros para o conselho da reitoria? 

Um amigo meu vai oferecer um jantar. Sua adega inclui 
8 garrafas de zinfandel, 10 de merlot e 12 de cabemet 
(ele só toma vinho tinto), todos de vinícolas diferentes, 

a. Se ele quiser servir 3 garrafas de zinfandel e a ordem 
para servir for importante, de quantas formas 
pode fazê-lo? 

Se forem selecionadas 6 garrafas de vinho aleatoria- 
mente entre as 30 disponíveis para servir, quantas 
formas há de selecioná-las? 

Se forem selecionadas 6 garrafas aleatoriamente, de 
quantas formas será possível selecionar duas gar- 
rafas de cada variedade? 

d. Se forem selecionadas 6 garrafas aleatoriamente, 
qual a probabilidade de serem escolhidas duas gar- 
rafas de cada variedade? 

e. Se forem selecionadas 6 garrafas aleatoriamente, 
qual a probabilidade de todas serem do mesmo tipo? 

a. Beethoven escreveu 9 sinfonias e Mozart escreveu 
27 concertos para piano. Se a estação de rádio de 
uma universidade desejar tocar primeiro uma sinfo- 
nia de Beethoven e depois um concerto de Mozart, 
de quantas formas pode ser feita a escolha? 

b. O gerente da rádio decide que em cada noite suces- 
siva (7 dias por semana) será tocada uma sinfonia de 
Beethoven, seguida por um concerto de piano de 
Mozart, seguido por um quarteto de cordas de Schu- 
bert (de um total de 15). Por cerca de quantos anos 
essa política pode continuar, antes que exatamente o 
mesmo programa seja repetido? 

32. Uma cadeia de lojas de aparelhos de som oferece um 
preço especial para o conjunto completo de compo- 
nentes (aparelho de som, CD-player, alto-falantes, toca- 
fitas). O comprador tem a seguinte opção de fabricante 
para cada componente: 


Aparelho de som: Kenwood, Onkyo, Pioneer, Sony, 

Sherwood 

CD-player: Onkyo, Pioneer, Sony, Technics 

Alto-falantes: Boston, Infinity, Polk 

Toca-fitas: Onkyo, Sony, Teac, Technics 


Um painel de ligação da loja permite ao cliente conectar 
qualquer seleção de componentes (um de cada tipo). Use 
a regra do produto para responder as seguintes perguntas: 


a. De quantas formas um componente de cada tipo 
pode ser selecionado ? 

b. De quantas formas os componentes podem ser se- 
lecionados se o aparelho de som e o CD-player 
forem Sony? 

c. De quantas formas os componentes podem ser sele- 
cionados se nenhum for Sony? 

d. De quantas formas pode ser feita uma seleção se ao 
menos um componente Sony for incluído? 

e. Se os interruptores forem ligados de forma total- 
mente aleatória, qual será a probabilidade de o sis- 
tema selecionado conter ao menos um componente 
Sony? E exatamente um componente Sony? 

33v Logo após terem sido colocados em serviço, alguns 
ônibus fabricados por uma determinada empresa apre- 
sentaram trincas na parte inferior do chassi. Suponha 
que uma cidade tenha 25 desses ônibus e que haja trin- 
cas em 8 deles. 

a. Há quantas formas de selecionar uma amostra de 5 
ônibus dos 25 para uma inspeção completa? 

b. De quantas formas uma amostra de 5 ônibus pode 
conter exatamente 4 com trincas visíveis? 

c. Se uma amostra de 5 ônibus for selecionada ao acaso, 
qual é a probabilidade de exatamente 4 dos 5 apre- 
sentarem trincas visíveis? 

d. Se os ônibus forem selecionados como na parte (c), 

qual é a probabilidade de que pelo menos 4^ dos 
ônibus selecionados tenham trincas visíveis? £ f 

34. Uma instalação de produção emprega 20 operários no 
turno diurno, 15 operários no noturno e 10 operários 
no da madrugada. Um consultor de controle de quali- 
dade deve selecionar 6 desses operários para entrevis- 
tas detalhadas. Suponha que a seleção seja feita de tal 
forma que qualquer grupo específico de 6 operários te- 
nha a mesma possibilidade de ser selecionado que 
qualquer outro grupo (escolha de 6 nomes sem reposi- 
ção entre 45). 

a. Quantas escolhas contêm 6 operários do turno 
diurno? Qual é a probabilidade de os 6 operários se- 
lecionados serem do turno diurno? 

b. Qual é a probabilidade de os 6 operários seleciona- 
dos serem do mesmo turno? 

c. Qual é a probabilidade de pelo menos dois tur- 
nos diferentes terem representantes entre os operá- 
rios selecionados? 

d. Qual é a probabilidade de pelo menos um dos turnos 
não ter representante na amostra de operários? 

35. Um departamento acadêmico com cinco membros 
docentes restringiu sua escolha para chefe do departa- 
mento ao candidato A ou candidato B. Cada membro 
então votou em um dos candidatos em uma cédula. 
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Suponha que haja três votos para o candidato A e dois 
para o candidato B. Se as cédulas forem selecionadas 
para contagem em ordem aleatória, qual é a probabili- 
dade de A se manter à frente de B na contagem dos vo- 
tos (por exemplo: esse evento ocorre se a ordem sele- 
cionada for AABAB, mas não se for ABBAA)? 

Um pesquisador está estudando os efeitos da tempera- 
\ tura, da pressão e do tipo de catalisador no resultado de 
certa reação química. Três temperaturas diferentes, 
quatro pressões diferentes e cinco catalisadores diferen- 
tes são considerados. 

a. Se cada teste envolver a utilização de uma única 
temperatura, pressão e catalisador, quantos testes 
serão possíveis? 

b. Quantos testes envolvem o uso da menor tempe- 
ratura e de duas menores pressões? 

37. Refira-se ao o exercício 36 e suponha que cinco testes 
diferentes sejam feitos no primeiro dia de experiência. 
Se os cinco forem selecionados aleatoriamente dentre 
todas as possibilidades, de forma que qualquer grupo 
de cinco tenha a mesma probabilidade de escolha, qual 
a probabilidade de que um catalisador diferente seja 
usado em cada teste? 

38. Uma caixa em um depósito contém quatro lâmpadas de 
40W, cinco de 60W e seis de 75W. Suponha que três 
lâmpadas sejam selecionadas aleatoriamente. 

a. Qual a probabilidade de que exatamente duas das 
lâmpadas selecionadas sejam de 75W? 

b. Qual a probabilidade de que as três lâmpadas sele- 
cionadas tenham a mesma potência? 

c. Qual a probabilidade de que uma lâmpada de cada 
tipo seja selecionada? 

d. Suponha que as lâmpadas sejam selecionadas uma a 
uma até que seja encontrada uma de 75W. Qual a 
probabilidade de que seja necessário examinar pelo 
menos seis lâmpadas? 

39. Foram recebidos quinze telefones em uma assistência 
técnica autorizada. Cinco deles são celulares, cinco são 
sem fio e os outros cinco são telefones com fio. Supo- 
nha que esses componentes sejam numerados aleatoria- 
mente de 1, 2, ... , a 15 para definir a ordem em que 
serão consertados. 

a. Qual é a probabilidade de que todos os telefones 
sem fio estejam entre os primeiros 10 a serem 
consertados? 

b. Qual é a probabilidade de que após consertar 10 tele- 
fones, somente dois dos três tipos ainda estejam com 
conserto pendente? 

c. Qual é a probabilidade de que dois telefones de 
cada tipo estejam entre os primeiros seis a se- 
rem consertados? 


40. Três moléculas do tipo A , três do tipo #, três do tipo C 
e três do tipo D serão vinculadas uma à outra para for- 
mar uma cadeia molecular. Uma molécula desse tipo é 
ABCDABCDABCD e outra é BCDDAAABDBCC. 

a. Quantas moléculas desse tipo podem ser formadas? 
( Sugestão : se as três moléculas A forem diferentes 
uma da outra -A ,, A 2 e - assim como as B, C e D, 
quantas moléculas haverá? Como esse número será 
reduzido se não houver distinção entre as molé- 
culas A ?) 

b. Suponha que uma molécula composta do tipo des- 
crito seja selecionada aleatoriamente. Qual é a pro- 
babilidade de que todas as moléculas de cada tipo 
estejam juntas (como em BBBAAADDDCCQ1 

41. Uma professora de matemática deseja marcar uma 
reunião com cada um de seus oito assistentes, quatro 
homens e quatro mulheres, para discutir o curso de 
cálculo. Suponha que todas as seqüências de reuniões 
sejam igualmente prováveis de serem escolhidas. 

a. Qual é a probabilidade de que pelo menos uma as- 
sistente mulher esteja entre as primeiras três pessoas 
com quem a professora se reunirá? 

b. Qual é a probabilidade de que após as primeiras 
cinco reuniões ela tenha se reunido com todas as as- 
sistentes mulheres? 

c. Suponha que a professora tenha os mesmos oito as- 
sistentes no semestre seguinte e marque reuniões 
sem considerar a ordem seguida no primeiro semes- 
tre. Qual a probabilidade de que a ordem dos com- 
promissos seja diferente? 

42. Três casais compraram ingressos de teatro e estão senta- 
dos em uma fileira que consiste em apenas seis assentos. 
Se eles se sentarem de uma forma totalmente aleatória 
(ordem aleatória), qual será a probabilidade de Jim e 
Paula (marido e mulher) se sentarem nos dois assentos 
da esquerda? Qual é a probabilidade de Jim e Paula se 
sentarem um ao lado do outro? Qual é a probabilidade 
de que ao menos uma das esposas se sente ao lado de 
seu respectivo marido ? 

43. No pôquer de cinco cartas, um straight consiste em 
cinco cartas com denominações adjacentes (por exem- 
plo: 9 de paus, 10 de copas, valete de copas, dama de 
espadas e rei de paus). Assumindo que os ases podem 
ficar nas duas pontas, se você receber um jogo de cinco 
cartas, qual é a probabilidade de que ele será um 
straight com a carta 10 alta? Qual é a probabilidade de 
se receber um straight ? Qual é a probabilidade de ser 
um straight flush (todas as cartas do mesmo naipe)? 

44. Mostre que (J) = („!*). Forneça uma interpretação en- 
volvendo subconjuntos. 
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2.4 I Probabilidade Condicional 


As probabilidades atribuídas a diversos eventos dependem do que seja conhecido sobre a situação experimen- 
tal quando a atribuição é feita. Depois da atribuição inicial, informações parciais sobre ou relevantes para o re- 
sultado do experimento podem estar disponíveis. Essas informações podem fazer com que revisemos algumas 
atribuições de probabilidade. Para um determinado evento A , usamos P(A) para representar a probabilidade 
atribuída a A. Agora interpretamos P(A) como a probabilidade original ou incondicional do evento A. Nesta se- 
ção, examinamos como a informação “ocorreu um evento B ” afeta a probabilidade atribuída a A. Por exemplo: 
A pode se referir a um indivíduo que tenha determinada doença pela presença de alguns sintomas. Se for feito 
um exame de sangue no indivíduo e o resultado for negativo (B = exame de sangue negativo), então a proba- 
bilidade de ter a doença será alterada (ela deve diminuir, mas normalmente não para zero, já que os exames de 
sangue não são infalíveis). Usaremos a notação P(A \ B) para representar a probabilidade condicional de A 
dado que ocorreu o evento B. 

Exemplo 2.24 

Componentes complexos são montados em uma fábrica que usa duas linhas de montagem diferentes: A e A'. A 
linha A usa equipamentos mais antigos que A de forma que é mais lenta e um pouco menos confiável. Suponha 
que em determinado dia, a linha A tenha montado 8 componentes, dos quais 2 foram identificados como de- 
feituosos (B) e 6 como não-defeituosos (B'), ao passo que a linha A' produziu 1 defeituoso e 9 não-defeituosos. 
Essas informações estão resumidas na tabela a seguir. 



Condição 



B 

B' 

Linha 

A 2 

6 

A' 1 

9 


Não tendo essas informações, o gerente de vendas seleciona aleatoriamente 1 desses 1 8 componentes para uma 
demonstração. Antes da demonstração 


P ( componente selecionado da linha A) = P(A) = 


m) 

N 


= — = 0 44 
18 ’ 


Entretanto, se o componente escolhido tiver defeito, o evento B terá ocorrido, de forma que o componente deve 
ser 1 dos 3 na coluna B da tabela. Como esses 3 componentes são igualmente prováveis entre si após a ocor- 
rência de B, 


p (A | fi ) = ±= J8 = 


. P(A n B) 


P(B) 


( 2 . 2 ) 


Na Equação (2.2), a probabilidade condicional é expressa como uma relação entre probabilidades não- 
condicionais: o numerador é a probabilidade de interseção dos dois eventos, enquanto o denominador é a pro- 
babilidade do evento de condição B. Um diagrama de Venn esclarece a relação (veja a Figura 2.8). 
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Figura 2.8 Demonstração da definição de probabilidade condicional 

Dado que B ocorreu, o espaço amostrai relevante não é mais S, mas consiste em resultados contidos em B\ 
A ocorreu se, e somente se, um dos resultados da interseção tiver ocorrido, de forma que a probabilidade condi- 
cional de A dado B é proporcional a P(A fl B). A proporção constante 1 /P(B) é utilizada para assegurar que a 
probabilidade P(B \ B) do novo espaço amostrai de B seja igual a 1. 


Definição de probabilidade condicional 

O Exemplo 2.24 demonstra que, quando os resultados são igualmente prováveis, o cálculo de probabilidades 
condicionais pode se basear na intuição. Quando os experimentos são mais complicados, a intuição pode nos en- 
ganar. portanto queremos uma definição geral de probabilidade condicional que forneça respostas intuitivas em 
problemas simples. O diagrama de Venn e a Equação (2.2) indicam a definição apropriada. 


DEFINIÇÃO 


Para quaisquer dois eventos AeB com P(B) > 0, a probabilidade condicional de A dado 
que ocorreu B é definida por 


P(A | B) 


P(A n B ) 
P(B) 


(2.3) 


Exemplo 2.25 

Suponha que, de todos os indivíduos que compram uma determinada câmera digital, 60% incluem um cartão de 
memória opcional na compra, 40% incluem uma pilha extra e 30% incluem um cartão e uma pilha. Considere a 
seleção aleatória de um comprador e sejam A = {compra de cartão de memória) e B = {compra de pilha). Dessa 
forma, P(A) = 0,60. P(B) = 0,40 e P(compra de ambos) = P(A fl B) = 0.30. Dado que o indivíduo selecionado 
comprou uma pilha extra, a probabilidade de compra de um cartão opcional é 

P(A | B) = — n - = 9^9 = 0,75 
1 P(B) 0,40 

Isto é, de todos os que compraram uma pilha extra, 75% compraram um cartão de memória extra. De 
forma análoga, 

P(pilha | cartão de memória) = P(B | A) = — = 9^9 = 0,50 

P(A ) 0,60 

Observe que P(A \ B) * P(A) e P(B \ A) # P(B). ■ 

Exemplo 2.26 

Uma revista publica três colunas, intituladas “Arte” (A), “Livros” (B) e “Cinema” (C). Os hábitos de leitura de 
um leitor selecionado aleatoriamente em relação a essas colunas são: 

Lê regularmente A B C A D B A D C B D C AflPflC 

Probabilidade 0,14 0,23 0,37 0,08 0,09 0,13 0,05 


(Veja a Figura 2.9.) 
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Figura 2.9 Diagrama de Venn do Exemplo 2.26 


Assim, temos: 


nA | B)= MM = 0J =0 , 348 

1 P(B) 0,23 


P(A|flüO= P(/in(flUC »= 0.04 + 0.05 + 0.03 = 0J2 5 

P(B U O 0,47 0.47 


P(A | lê pelo menos uma) = P{A |aUBUQ = U C)^ 


= m = oj4 = 0286 

P(A UBUC) 0,49 


e 


P(A U B\C) ~ P((A Ug)fl ° = °’ Q4 + °’ 05 + °’ Q8 = 0459 
P(C) 0,37 


A regra da multiplicação para P(A D B) 

A definição de probabilidade condicional fornece o resultado a seguir, obtido pela multiplicação de ambos os la- 
dos da equação (2.3) por P(B). 


A Regra da multiplicação 

P(A D B) = P(A | B) • P(B) 


Essa regra é importante porque freqüentemente se deseja P(A fl B), ao passo que P(B) e P(A | B) podem 
ser especificados pela descrição do problema. Considerando a expressão P(B\A) obtém-se P(A D B) = 

P(B\A)-P{A). 

Exemplo 2.27 

Quatro indivíduos responderam a uma solicitação de um banco de sangue para doação. Nenhum deles doou 
sangue antes, de forma que seus tipos sanguíneos são desconhecidos. Suponha que apenas o tipo 0+ seja dese- 
jado e apenas um dos quatro indivíduos tenha esse tipo sangüíneo. Se os doadores potenciais forem seleciona- 
dos em ordem aleatória para determinação do tipo sangüíneo, qual será a probabilidade de que pelo menos três 
indivíduos tenham de ser testados para obtenção do tipo desejado? 

Fazendo B = (primeiro tipo não 0+ } e A = (segundo tipo não 0+ }, P(B) = f. Dado que o primeiro tipo 
não é 0+, dois dos três indivíduos restantes não serão 0+, de forma que P(A \ B) = f. A regra de multiplicação 
agora fornece: 
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Pípelo menos três indivíduos foram testados) = P(A H B ) 

= P(A | B) • P(B ) 

- 1 . A = A 

3 4 12 

= 0,5 ■ 

A regra da multiplicação é mais útil quando o experimento consiste em diversas etapas consecutivas. O 
evento condicional B então descreve o resultado da primeira etapa e A descreve o resultado da segunda, de forma 
que P(A | B) - condicionado ao que ocorre primeiro - normalmente é conhecida. A regra é facilmente estendida 
a experimentos que envolvem mais de duas etapas. Por exemplo: 

P(A, n a 2 n a 3 ) = P(A, | a, n a 2 ) • p(a, n a 2 > 

= P(A 3 1 A, n A 2 ) • P(A 2 1 A,) • P(A,) (2.4) 

onde A, ocorre primeiro, seguido por A 2 e finalmente por A,. 

Exemplo 2.28 

Para o experimento de definição de tipo sangüíneo do Exemplo 2.27, 

P( terceiro tipo é 0+) = P( terceiro é | primeiro não é fl segundo não é) 

• P(segundo não é | primeiro não é) • P(primeiro não é) 



Quando o experimento consistir uma seqüência de diversas etapas, é conveniente representá-las em um dia- 
grama de árvore. Depois que tivermos um diagrama de árvore apropriado, as probabilidades e as probabilidades 
condicionais são inseridas nos diversos ramos; o que é feito com o uso da regra da multiplicação de forma direta. 

Exemplo 2.29 

Uma cadeia de lojas de vídeo vende três marcas diferentes de videocassetes. Dessas vendas, 50% são da marca 
1 (a mais barata), 30% são da marca 2 e 20% são da marca 3. Cada fabricante oferece um ano de garantia para 
peças e mão-de-obra. E sabido que 25% dos videocassetes da marca 1 necessitam de reparos de garantia, en- 
quanto os percentuais correspondentes para as marcas 2 e 3 são 20% e 10%, respectivamente. 

1. Qual é a probabilidade de que um comprador selecionado aleatoriamente compre um videocassete da 
marca 1 que precise de reparo durante a garantia? 

2. Qual é a probabilidade de que um comprador selecionado aleatoriamente possua um aparelho que ne- 
cessite de reparos durante a garantia? 

3. Se um cliente voltar à loja com um videocassete que precise de reparos em garantia, qual é a probabili- 
dade de ele ser da marca 1? E da marca 2? E da marca 3? 

A primeira etapa do problema envolve um cliente que escolhe uma de três marcas de videocassete. Seja 
Ai = {compra da marca /}, para i = 1, 2 e 3. Então P(A,) = 0,50, P(A 2 ) = 0,30 e P(A 3 ) = 0,20. 
Depois que a marca do videocassete for selecionada, a segunda etapa envolve a observação da necessidade de 
reparo na garantia. Com B = {precisa de reparo) e B' = {não precisa de reparo), as informações fornecidas im- 
plicam P(B | A,) = 0,25, P(B | A 2 ) = 0,20, e P(B | A,) = 0, 10. 

O diagrama de árvore que representa essa situação experimental é exibido na Figura 2.10. Os ramos ini- 
ciais correspondem a diferentes marcas de videocassetes e há ramos de segunda geração que partem da extremi- 
dade de cada ramo inicial: um para “precisa de reparo” e outro para “não precisa de reparo”. A probabilidade 
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P(A ,) é exibida no ramo inicial, enquanto as probabilidades condicionais P(B | A,) e P(B' | A,) são exibidas nos 
ramos de segunda geração. À direita de cada ramo de segunda geração correspondente à ocorrência de B exibi- 
mos o produto das probabilidades nos ramos que vão até o ponto. Isto é simplesmente a regra de multiplicação 
em ação. A resposta à pergunta proposta em 1, portanto, é P(A, D B) = P(B | A,) • P(A,) = 0,125. A resposta à 
pergunta 2 é 

P(B) = P[(marca 1 e reparo) ou (marca 2 e reparo) ou (marca 3 e reparo)] 

= P(A, D B) + P(A 2 n B) + P(A, n B) 

= 0,125 + 0,060 + 0,020 = 0,205 



P{B Ai)-P(A t ) = P(Br\Ai) = 0.125 


P(B A 2 )-P(A 2 ) = P(BHA 2 ) = 0,060 


P{B A 3 ) • P(A 2 ) = P(B n A 2 ) = 0,020 


P(B) = 0.205 


Figure 2.10 Diagrama de árvore do Exemplo 2.29 


Finalmente, 


e 


P(A,|S) = 


m, n b ) 

P(B) 


0,125 

0,205 


= 0,61 


P(A 2 \B) 


F(A : n B) 
P(B) 


0,060 _ Q -yg 
0,205 


P(A, | fl) = 1 — P(A , | fl) — P(A 2 1 B) = 0,10 


Observe que a probabilidade anterior ou inicial da marca 1 é 0,50, enquanto, depois que se sabe que o 
videocassete selecionado precisa de reparos, a probabilidade posterior da marca 1 aumenta para 0,61. Isso 
ocorre porque os videocassetes da marca 1 são igualmente mais prováveis de precisar de reparos do que os das 
outras marcas. A probabilidade posterior da marca 3 é P( A, I B) = 0,10, que é muito menor que a probabilidade 
anterior P(A 3 ) = 0,20. ■ 


Teorema de Bayes 

O cálculo de uma probabilidade posterior P(A ; | B) a partir de probabilidades anteriores dadas P(A,) e das pro- 
babilidades condicionais P(B \ A,) ocupa uma posição central em teoria elementar de probabilidade. A regra geral 
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desses cálculos, que na verdade é uma aplicação simples da regra de multiplicação, remete ao reverendo Thomas 
Bayes, que viveu no século XV11I. Para expressá-la, precisamos de outro resultado. Lembre-se de que os even- 
tos A„ . . . , A k são mutuamente exclusivos se nenhum par deles tiver resultados comuns. Os eventos são exaus- 
tivos se um A, tiver de ocorrer para que A, U • ■ • U A, = í 


Lei ou Teorema da probabilidade total 

Sejam A A k eventos mutuamente exclusivos e exaustivos. Então, para qualquer 
outro evento B, 

P(B) = P(B k)P(A,) + ... + P(B | A k )P(A k ) (2.5) 

= 2P(B\a í )P(A í ) 

í-i 


Demonstração 

Visto que os eventos A, são mutuamente exclusivos e exaustivos, se B ocorrer será com exatamente um dos A„ 
isto é. B = (A, e B) ou ... ou (A* e B) = (A, D B) U • • • U ( A k fl B), onde os eventos (A, D B) são mutuamente 
exclusivos. Essa “partição de B" é ilustrada na Figura 2.1 1. Assim, 

P(B) = Í P(A, HB) = £P(B\a,)P(A,) 

;= i «- 1 


conforme desejado. 



Figura 2.11 Partição de B pelos eventos mutuamente exclusivos e exaustivos A, ■ 

Um exemplo do uso da Equação (2.5) foi mostrado na resposta à pergunta 2 do Exemplo 2.29, onde A, = 
(marca 1 }, A, = (marca 2}, A 3 = (marca 3} e B = (reparo). 


Teorema de Bayes 

Sejam A,, A 2 , . . . , A k uma coleção de k eventos mutuamente exclusivos e 
exaustivos com P(A,) > 0 para i = 1, .... k. Então, para qualquer outro evento B em 
que P(B) > 0, 


P(A,\ 

m i*. k>-™ 


j = 1 k 


( 2 . 6 ) 


A transição da segunda para a terceira expressão em (2.6) baseia-se na aplicação da regra da multiplicação no 
numerador e da lei da probabilidade total no denominador. 

A proliferação de eventos e índices na expressão (2.6) pode intimidar usuários com pouca experiência em 
probabilidade. Desde que haja relativamente poucos eventos na partição, pode-se usar um gráfico de árvore 
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(como no Exemplo 2.29) como base para calcular as probabilidades posteriores sem referência explícita ao teo- 
rema de Bayes. 

Exemplo 2.30 

Incidência de doença rara. Apenas 1 em 1 000 adultos é acometido por uma doença rara para a qual foi desen- 
volvido um teste de diagnóstico. O teste funciona de tal forma que, se o indivíduo tiver a doença, o resultado do 
teste será positivo em 99% das vezes e, se não a tiver, será positivo em apenas 2% das vezes. Se um indivíduo 
selecionado aleatoriamente for testado e o resultado for positivo, qual é a probabilidade de ele ter a doença? 

Para usar o teorema de Bayes, considere por A, = {indivíduo tem a doença), A 2 = {indivíduo não tem a 
doença) e B = {resultado do teste positivo). Então, P(A,) = 0,001, P(A 2 ) = 0,999. P(B\a { ) = 0,99. e 
P(B\a 2 ) = 0,02. O diagrama de árvore deste problema está na Figura 2.12. 



Figura 2.12 Diagrama de árvore para o problema da doença rara 


Próximo a cada ramo correspondente a um resultado positivo, a regra de multiplicação indica as probabili- 
dades registradas. Portanto, P(B) = 0,00099 + 0,01998 = 0,02097, pelo qual obtemos 


P(A,\B) 


m, n g) _ q,ooo99 = 0047 
P(B) 0,02097 


O resultado parece ir de encontro à intuição. O resultado do teste parece tão preciso que esperamos que al- 
guém com um resultado positivo tenha alta probabilidade de ter a doença, enquanto a probabilidade condicional 
calculada é de apenas 0,047. Entretanto, como a doença é rara e o teste é moderadamente confiável, a maior parte 
dos resultados positivos dos testes provém de erros e não de indivíduos doentes. A probabilidade de ter a doença 
foi aumentada por um fator multiplicativo 47 (da probabilidade anterior 0,001 para a posterior 0,047); mas, para 
se obter maior aumento na probabilidade posterior, é necessário um teste de diagnóstico com menores taxas de 
erros. Se a doença não fosse tão rara (por exemplo, 25% de incidência na população), as taxas de erros do pre- 
sente teste forneceriam um bom diagnóstico. ■ 


Exercícios 


Seção 2.4 (45-67) 


45. A população de um país consiste em três grupos 
étnicos. Cada indivíduo pertence a um de quatro 
grupos sangíiíneos principais. A tabela de probabili- 
dade conjunta fornece as proporções de indivíduos 
nas diversas combinações de grupos étnicos- 
grupos sangüíneos. 


Grupo sangüíneo 
O A B AB 

1 0,082 0,106 0,008 0.004 

Grupo étnico 2 0,135 0,141 0,018 0,006 

3 0,215 0,200 0,065 0,020 
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Suponha que um indivíduo seja selecionado aleatoria- 
mente da população e defina os eventos A = {tipo A se- 
lecionado}, B = {tipo B selecionado} e C = (grupo 
étnico 3 selecionado). 

a. Calcule P{A), P(C ), e P(A fl Q. 

b. Calcule P(A \ Q e P(C \ A) e explique, no contexto, o 
que significa cada uma dessas probabilidades. 

c. Se o indivíduo selecionado não tiver o tipo sangüí- 
neo B, qual é a probabilidade de que ele ou ela seja 
do grupo étnico 1 ? 

46 . Suponha que um indivíduo seja selecionado aleatoria- 
mente da população de todos os homens adultos que 
vivem nos Estados Unidos. Sejam A o evento em que o 
indivíduo selecionado tem mais de l,80m de altura e B 
o evento em que o indivíduo selecionado é um jogador 
profissional de basquete. Qual você pensa ser maior: 
P(A | B) ou P(B | A)? Por quê? 

47 . Volte ao cenário dos cartões de crédito do Exercício 12 
" (Seção 2.2), onde A = {Visa}, B = {MasterCard), 

P(A) = 0,5, P(B) = 0,4 e P{A n B) = 0,25. Calcule e 
interprete cada uma das probabilidades a seguir (um 
diagrama de Venn pode ser útil), 

a. P(B\A) b. P(B'\A) 
c. P(a \b) d. P(A' jõ) 

e. Dado que o indivíduo selecionado tem ao menos um 
cartão de crédito, qual é a probabilidade de ele ter 
um cartão Visa? 

48 . Reconsidere a situação de defeitos descrita no Exercí- 
cio 26 (Seção 2.2). 

a. Dado que o sistema tem um defeito do tipo 1 , qual é 
a probabilidade de ele ter um defeito do tipo 2? 

b. Dado que o sistema tem um defeito do tipo 1, 
qual é a probabilidade de ele ter os três tipos de 
defeitos? 

c. Dado que o sistema tem ao menos um tipo de de- 
feito, qual é a probabilidade de ele ter exatamente 
um tipo de defeito? 

d. Dado que o sistema tem os dois primeiros tipos de 
defeitos, qual é a probabilidade de ele não ter o ter- 
ceiro tipo de defeito? 

49 . Se duas lâmpadas forem selecionadas aleatoriamente 
da caixa do Exercício 38 (Seção 2.3) e pelo menos uma 
delas for de 75W, qual é a probabilidade de que ambas 
gerem 75W? Dado que pelo menos uma das lâmpadas 
não seja de 75W, qual é a probabilidade de ambas as 
lâmpadas selecionadas terem a mesma potência? 

50. Uma loja de departamentos vende camisas esportivas 
em três tamanhos (pequeno, médio e grande), três 
padrões (xadrez, estampado e listrado) e dois compri- 
mentos de manga (curta e longa). As tabelas a seguir 
fornecem as proporções de camisas vendidas nas diver- 
sas combinações de categorias. 


Manga curta 




Padrão 


Tamanho 

Xadrez 

Estampado 

Listrado 

p 

0,04 

0,02 

0,05 

M 

0,08 

0,07 

0,12 

G 

0,03 

0,07 

0,08 

Manga longa 



Padrão 


Tamanho 

Xadrez 

Estampado 

Listrado 

p 

0,03 

0,02 

0,03 

M 

0,10 

0,05 

0,07 

G 

0,04 

0,02 

0,08 


a. Qual é a probabilidade de a próxima camisa vendida 
ser média, de mangas longas e estampada? 

b. Qual é a probabilidade de a próxima camisa vendida 
ser uma camisa média, estampada? 

c. Qual é a probabilidade de a próxima camisa vendida ser 
de mangas curtas? E de mangas longas? 

d. Qual é a probabilidade de a próxima camisa vendida 
ser média? E de ser estampada? 

e. Dado que a última camisa vendida foi uma xadrez de 
mangas curtas, qual é a probabilidade de o tamanho 
ser médio? 

f. Dado que a última camisa vendida foi uma média e 
xadrez, qual é a probabilidade de as mangas serem 
curtas? E de serem longas? 

51 . Uma caixa contém seis bolas vermelhas e três verdes e 
uma segunda caixa contém sete bolas vermelhas e três 
verdes. Uma bola é retirada da primeira caixa e colo- 
cada na segunda. Então uma bola é retirada da segunda 
caixa e colocada na primeira. 

a. Qual é a probabilidade de uma bola vermelha ser se- 
lecionada na primeira caixa e outra bola vermelha 
na segunda? 

b. No fim do processo de seleção, qual é a probabilidade 
de o número de bolas vermelhas e verdes da primeira 
e da segunda caixas ser idêntico ao do início? 

52 . Um sistema consiste em duas bombas idênticas, n 2 1 e 
n 2 2. Se uma bomba falha, o sistema continua em ope- 
ração. Entretanto, devido ao esforço adicional, a bomba 
restante passa a estar mais suscetível a falhas do que 
originalmente. Isto é, r = P( n 2 2 falha | n 2 1 falha) > 
P(n 2 2 falha) = q. Se pelo menos uma das bombas fa- 
lhar durante a vida útil do sistema 7% das vezes e 
ambas as bombas falharem durante aquele período em 
apenas 1% das vezes, qual é a probabilidade de a 
bomba n 2 1 falhar durante a vida útil do sistema? 

53 . Certa loja faz reparos em componentes de áudio e 
vídeo. Represente por A o evento em que o próximo 
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componente trazido para conserto seja de áudio e por B 
o evento em que o próximo componente seja um CD- 
player (de forma que o evento B está contido em A). 
Suponha que P(A) = 0,6 e P(B) = 0,05. Qual é 
P(B\A)? 

54. No Exercício 13, A, = {projeto escolhido i}, para i = 
1, 2, 3. Use as probabilidades fornecidas para calcular 
as probabilidades a seguir: 

a. P(A 2 |a,) 

b. p ( a 2 n a , a,) 

c. P(A 2 U a , A,) 

d. P(A , n A 2 n Aj I Ay U A 2 U a,). 

Expresse em palavras a probabilidade calculada. 

55. No Exercício 42, seis pessoas (três casais) escolheram 
assentos aleatoriamente em uma fileira formada por 
seis assentos. 

a. Use a regra da multiplicação para calcular a proba- 
bilidade de Jim e Paula se sentarem juntos à es- 
querda (evento A) e de John e Mary Lou (marido e 
mulher) se sentarem juntos no meio (evento B). 

b. Dado que John e Mary Lou sentam-se juntos no 
meio, qual é a probabilidade de os outros dois mari- 
dos se sentarem junto a suas esposas? 

c. Dado que John e Mary Lou sentam-se juntos, qual é 
a probabilidade de todos os maridos se sentarem 
junto a suas esposas? 

56. Se P(fl | A) > P(B ), mostre que P(B' \ A) < P(B'). ( Su- 
gestão: Adicione P(B' | ,4) aos dois lados da inequação 
fornecida e então use o resultado do Exercício 57.) 

57. Para quaisquer eventos Ae B com P(B) > 0, mostre que 
P(A | B) + P(A'\B) = 1. 


58. Demonstre que para quaisquer três eventos A, B, e C 
com P(Q> 0, P(A\JB\Q = P(A\Q + P(B\Q- 
P(A n fi | O. 

59. Em determinado posto de gasolina, 40% dos clientes 
\usam gasolina comum (A,), 35% usam gasolina aditi- 

vada (A 2 ) e 25% usam gasolina premium (A 3 ). Dos 
clientes que usam gasolina comum, apenas 30% 
enchem o tanque (evento B). Dos clientes que usam 
gasolina aditivada e premium , 60% enchem o tanque, 
enquanto dentre os que usam premium , 50% enchem 
o tanque. 

a. Qual é a probabilidade de o próximo cliente pedir 
gasolina aditivada e encher o tanque (A 2 H B)1 

b. Qual é a probabilidade de o próximo cliente encher 
o tanque? 

c. Se o próximo cliente encher o tanque, qual é a pro- 
babilidade de pedir gasolina comum? E gasolina 
aditivada? E gasolina premium ' ? 

60. Setenta por cento das aeronaves leves que desaparecem 
em voo em certo país são localizadas posteriormente. 
Das aeronaves localizadas, 60% possuem localizador de 
emergência, enquanto 90% das aeronaves não localiza- 
das não possuem esse dispositivo. Suponha que uma ae- 
ronave leve tenha desaparecido. 


a. Se ela tiver localizador de emergência, qual é a pro- 
babilidade de não ser localizada? 

b. Se ela não tiver localizador de emergência, qual é a 
probabilidade de ser localizada? 

61. Componentes de determinado tipo são enviados a um 
fornecedor em lotes de 10. Suponha que 50% desses lo- 
tes não contenham componentes defeituosos, 30% con- 
tenham um componente defeituoso e 20% contenham 
dois componentes defeituosos. Dois componentes de 
um lote são selecionados aleatoriamente e testados. 
Quais são as probabilidades associadas a 0, 1 e 2 com- 
ponentes defeituosos estarem no lote em cada uma das 
condições a seguir? 

a. Nenhum componente testado apresenta defeito. 

b. Um de dois componentes testados apresenta defeito. 
( Sugestão . Desenhe um diagrama de árvore com três 
ramos de primeira geração para os três tipos dife- 
rentes de lotes.) 


62. Uma empresa que fabrica câmeras de vídeo produz um 
modelo básico e um modelo luxo. No ano passado, 
40% das câmeras vendidas foram do modelo básico. 
Dos clientes que compraram o modelo básico, 30% 
compraram uma garantia estendida, enquanto 50% dos 
compradores do modelo luxo a compraram. Se você 
souber que um cliente selecionado aleatoriamente pos- 
sui uma garantia estendida, qual a probabilidade de ele 
ter o modelo básico? 



Considere os eventos a seguir para clientes que com- 
pram um conjunto de pneus em uma determinada loja, 
considere os eventos 


A = {os pneus comprados foram fabricados nos 
Estados Unidos} 

B = {o comprador fez o balanceamento dos pneus ime- 
diatamente} 

C = {o comprador solicita alinhamento dianteiro 
e traseiro} 

em conjunto com A', B\ e C . Assuma as probabili- 
dades condicionais e não-condicionais a seguir: 

P(A) = 0,75 P(B | A) = 0,9 P(B|a') = 0,8 

pícIa n B) = 0,8 p(c|a n B') = 0,6 

P(C|A'nfl) = 0,7 P(C|A' HB') = 0,3 

a. Construa um diagrama de árvore formado por ramos 
de primeira, segunda e terceira gerações, identifique 
cada evento e a probabilidade apropriada próximo a 
cada ramo. 

b. Calcule P(A D B H Q. 

c. Calcule P(B fl C). 

d. Calcule P(C). 

e. Calcule P(A | B O C), a probabilidade de uma com- 
pra de pneus americanos, dado que são solicitados 
alinhamento e balanceamento. 

64. No Exemplo 2.30, suponha que a taxa de incidência da 

doença seja de 1 em 25, em vez de 1 em 1000. Qual 
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será entáo a probabilidade de um resultado positivo do 
teste? Dado que o resultado é positivo, qual a probabi- 
lidade de o indivíduo ter a doença? Dado um resultado 
negativo, qual a probabilidade de o indivíduo não ter 
a doença? 

65. Em uma grande universidade, na pesquisa por um livro- 
texto satisfatório, o departamento de estatística testou 
um livro diferente durante os últimos três trimestres. No 
trimestre do outono, 500 alunos usaram o livro do pro- 
fessor Média; durante o inverno, 300 alunos usaram o 
livro do professor Mediana e durante a primavera, 200 
alunos usaram o livro do professor Moda. Uma 
pesquisa no final de cada trimestre mostrou que 200 es- 
tavam satisfeitos com o livro do Média, 150 estavam 
satisfeitos com o livro do Mediana e 160 estavam satis- 
feitos com o livro do Moda. Se um aluno que estudou 
estatística durante um dos trimestres for selecionado 
aleatoriamente e admitir estar satisfeito com o livro- 
texto, ele terá mais probabilidade de ter usado o livro do 
Média, do Mediana ou do Moda? Quem é o autor igual- 
mente menos provável? ( Sugestão : Desenhe um dia- 
grama de árvore ou use o teorema de Bayes.) 

66. Uma amiga que vive em Los Angeles faz viagens fre- 
qüentes de consultoria para Washington, D.C. Cin- 
qüenta por cento das vezes ela viaja pela linha aérea n u 
1, 30 % das vezes pela n a 2 e os 20 % restantes das vezes 
pela n a 3. Na linha n c 1, os voos para Washington atra- 
sam 30% das vezes e para L.A., 10% das vezes. Na linha 
aérea n fl 2, essas porcentagens são 25% e 20%, en- 
quanto na linha aérea n ü 3 são 40% e 25%. Se soubermos 
que em uma viagem ela chega atrasada em exata- 
mente um dos destinos, quais são as probabilidades 


posteriores de ela ter voado nas linhas n c 1, n ü 2 e n Q 3? 
( Sugestão : Na extremidade de cada ramo de primeira 
geração em um diagrama de árvore, desenhe três ramos 
de segunda geração denominados 0 atrasado, 1 atrasado 
e 2 atrasado.) 

>7/No Exercício 59, considere as informações adicionais a 
seguir sobre a utilização de cartões de crédito: 

70% de todos os clientes da gasolina comum que en- 
chem o tanque usam um cartão de crédito. 

50% de todos os clientes da gasolina comum que não 
enchem o tanque usam um cartão de crédito. 

60% de todos os clientes da gasolina extra que enchem 
o tanque usam um cartão de crédito. 

50% de todos os clientes da gasolina extra que não en- 
chem o tanque usam um cartão de crédito. 

50% de todos os clientes da gasolina prentium que en- 
chem o tanque usam um cartão de crédito. 

40% de todos os clientes da gasolina premi um que não 
enchem o tanque usam um cartão de crédito. 

Calcule a probabilidade de cada um dos eventos a se- 
guir para o próximo cliente a ser atendido (um dia- 
grama de árvore pode ajudar). 

a. (extra, tanque cheio e cartão de crédito} 

b. {premi um, não tanque cheio e cartão de crédito} 

c. [premium e cartão de crédito} 

d. (tanque cheio e cartão de crédito} 

e. (cartão de crédito} 

f. se o próximo cliente usar cartão de crédito, qual a pro- 
babilidade de que seja pedida a gasolina premium ? 


2.5 


Independência 


A definição de probabilidade condicional nos permite revisar a probabilidade P(A) originalmente atribuída a A 
quando somos informados posteriormente da ocorrência de outro evento B. A nova probabilidade de A é P(A I B). 
Em nossos exemplos, normalmente ocorria de P(A \ B) ser diferente da probabilidade não-condicional P(A\ in- 
dicando que a informação “ B ocorreu” resultou em uma alteração da possibilidade de ocorrência de A. Há ou- 
tras situações em que a possibilidade de ocorrência de A não é afetada pelo conhecimento da ocorrência de B, 
de forma que P(A \ B) = P(A). É natural, então, pensar em A e B como eventos independentes, indicando que a 
ocorrência ou não-ocorrência desses eventos não afeta a possibilidade de ocorrer o outro evento. 


DEFINIÇÃO 
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A definição de independência pode parecer “assimétrica” porque não se exige também que P(B | A) = P(B). 
Entretanto, usando a definição de probabilidade condicional e a regra da multiplicação. 


P(B\A) = 


P(A n B) = P(A I g)P(fi) 
P(A) P(A) 


(2.7) 


O lado direito da Equação (2.7) é P(B) se, e somente se, P(A \ B) = P(A) (independência), de forma que a 
igualdade da definição implica outra igualdade (e vice-versa). Também é fácil demonstrar que, se A e B forem 
independentes, os seguintes pares de eventos também o serão: (1) A' e B, (2) AeB',e (3) A' e B'. 

Exemplo 2.31 

Considere o lançamento de um dado uma vez e defina os eventos A = {2, 4, 6}, fl = {1, 2, 3}, e C = 
{ 1, 2, 3, 4}. Temos então P(A ) = P(A | B) = } e P(A \ C) = Isto é, os eventos A e B são dependentes, en- 
quanto os eventos A e C são independentes. Intuitivamente, se esse dado for lançado e formos informados de que 
o resultado foi 1 , 2, 3 ou 4 (C ocorreu), a probabilidade de A ter ocorrido é \ , conforme era inicialmente, já que 
dois dos quatro resultados relevantes são pares e são igualmente prováveis. ■ 

Exemplo 2.32 

Sejam A e B dois eventos mutuamente exclusivos com P(A) > 0. Por exemplo: para um automóvel escolhido 
aleatoriamente, seja A = {o carro possui quatro cilindros} e B = (o carro possui seis cilindros}. Como os even- 
tos são mutuamente exclusivos, se B ocorrer, A não pode ter ocorrido, de forma que P(A I B) = 0 ^ P(A). A men- 
sagem aqui é: se dois eventos forem mutuamente exclusivos , não podem ser independentes. Quando A e B são 
mutuamente exclusivos, a informação da ocorrência de A indica algo sobre B (não pode ter ocorrido), de forma 
que a independência é excluída. ■ 


P(A n B) Quando os eventos são independentes 

Freqüentemente a natureza de um experimento indica que dois eventos A e B devem ser considerados indepen- 
dentes. Este é o caso, por exemplo, de um fabricante que recebe uma placa de circuito de cada um de dois 
fornecedores diferentes; cada placa é testada em sua chegada e A = {a primeira tem defeito} e B = {a segunda 
tem defeito}. Se P(A) = 0,1, também deve ser o caso de P{A I B) = 0,1, sabendo que a condição da segun- 
da placa não fornece informações sobre as condições da primeira. Nosso próximo resultado mostra como cal- 
cular P(A H B) quando os eventos são independentes. 


PROPOSIÇÃO 


A e B são independentes se, e somente se. 


P(A fl B) = P(A) • P(B) 

(2.8) 


Parafraseando a proposição, A t B são eventos independentes se, e somente se, a probabilidade de ambos 
ocorrerem (A fl B) for o produto de duas probabilidades individuais. Segue a demonstração: 

P(A nfl) = P(A I B ) • P(B) = P(A) • P(B) (2.9) 

onde a segunda igualdade da Equação (2.9) é válida se, e somente se, A e B forem independentes. Por 
causa da equivalência de independência pela Equação (2.8), esta última pode ser usada como definição 
de independência. 
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Exemplo 2.33 

Sabe-se que 30% das lavadoras de roupa de uma determinada empresa requerem manutenção enquanto estiverem na 
garantia e somente 10% das secadoras de roupa precisam de manutenção. Se alguém comprar uma lavadora e uma 
secadora de roupas feitas por essa empresa, qual é a probabilidade de que ambas as máquinas precisem de conserto? 

Seja A o evento em que a lavadora precisa de manutenção em garantia e B o evento análogo para a secadora. 
Então P(A) = 0,30 e P(B) = 0.10. Assumindo que as máquinas funcionem de forma independente uma da outra, 
a probabilidade desejada será 

P(A D B) = P(A) • P(B) = (0,30)(0,10) = 0,03 
A probabilidade de que nenhuma das máquinas precise de serviço é 

P(A' PI B') = P{A') • P(B') = (0,70)(0,90) = 0,63 ■ 


Exemplo 2.34 

Cada dia. de segunda a sexta-feira, chega em uma determinada instalação de inspeção um lote de componentes 
enviado por um fornecedor. Duas vezes por semana, chega um lote de um segundo fornecedor. Oitenta por cento 
de todos os lotes do fornecedor 1 passam na inspeção, assim como 90% dos lotes do fornecedor 2. Qual é a pro- 
babilidade de. em um dia selecionado aleatoriamente, dois lotes passarem na inspeção? Responderemos a essa 
questão assumindo que, em dias em que os dois lotes são testados, os fatos de o primeiro ou de o segundo lote 
passarem ou não na inspeção são independentes. A Figura 2.13 exibe as informações relevantes. 



P( ambos passam) = P(dois recebidos D ambos passam) 

= P(ambos passam | dois recebidos) • P(dois recebidos) 

= [(0,8)(0,9)](0,4) = 0,288 ■ 

Independência de mais de dois eventos 

A noção de independência de dois eventos pode ser estendida para coleções de mais de dois eventos. Apesar de 
ser possível estender a definição para dois eventos independentes trabalhando em termos de probabilidades 
condicionais e não-condicionais, é mais direto e menos trabalhoso seguir a linha da última proposição. 


DEFINIÇÃO 


Os eventos A,, ..., A„ são mutuamente independentes se para cada k (k = 2, 3, ... , n) e 
cada subconjunto de índices i,, i 2 , ..., i*, 

m„). 


P(A„ n A, n • • • n a,) = p(aq • p(aj 
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Parafraseando a definição, os eventos serão mutuamente independentes se a probabilidade da interseção de 
qualquer subconjunto dos n eventos for igual ao produto das probabilidades individuais. Como foi o caso de dois 
eventos, freqüentemente especificamos a independência de certos eventos no início do problema. A definição 
pode então ser usada para calcular a probabilidade de uma interseção. 

Exemplo 2.35 

O artigo “Reliability Evaluation of Solar Photovoltaic Arrays” (Solar Energy, 2002. p. 129-141) apresenta 
diversas configurações de matrizes fotovoltáticas solares formados por células solares de silício cristalino. Con- 
sidere o sistema ilustrado na Figura 2.14 (a). Há dois subsistemas ligados em paralelo, cada um com três 
células. Para que o sistema funcione, pelo menos dois subsistemas paralelos devem funcionar. Em cada sub- 
sistema, as três células estão ligadas em série, de forma que um subsistema só funciona se todas as suas célu- 
las estiverem funcionando. Considere a vida útil t„ e suponha que se queira determinar a probabilidade da vida 

útil do sistema exceder Seja A, o evento vida útil da célula i excede t 0 (i = 1, 2 6). Assumimos que os 

eventos A, sejam independentes (se alguma célula específica durar mais de t 0 horas não tem nenhuma relação 
com a duração das outras células) e que P(A,) = 0,9 para cada i, já que as células são idênticas. Então 

P(vida útil do sistema excede t 0 ) = P[(A, fl A 2 D A 3 ) U (A 4 D A, fl A 6 )] 

= P(A t n a 2 n A,) + p(a 4 n a 5 n a 6 ) 

- p [(A t n a, n a 3 ) n (a 4 n a, n a 6 )] 

= (0.9X0.9X0.9) + (0.9X0,9X0,9) - (0.9X0,9X0,9X0,9X0.9X0,9) = 0,927 

De forma alternativa, 

P(vida útil do sistema excede t 0 ) = 1 - P ( a vida útil de ambos os subsistemas são £ r 0 ) 

= 1 — [P(vida útil do subsistema é s r 0 )] 2 
= 1 — [1 — P(vida útil do subsistema é > f 0 )] 2 
= 1 - [1 - (0,9) 3 ] 2 = 0,927 

Em seguida, considere o sistema cruzado da Figura 2.14(b), obtido do arranjo série-paralelo pela ligação 
das colunas de junção. 



1 


2 


3 




1 


2 


- 3 
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6 




4 


5 


6 



(a) (b) 

Figura 2.14 Configurações de sistema do Exemplo 2.35: (a) série-paralelo; (b) cruzado 

Neste caso o sistema falhará se houver falha de uma coluna, e a vida útil do sistema excederá t 0 apenas se 
a vida útil de cada coluna também exceder essa configuração, 

P(vida útil do sistema é no mínimo /,,) = [P(vida útil da coluna excede / 0 )] 3 

= [1 — P(vida útil da coluna é ^ /„)]’ 

= [1 - P( ambas as células da coluna têm vida útil < í 0 )] 3 

= [1 - (1 - 0,9) 2 ] 3 = 0,970 


Probabilidade - Jay L. Devore 79 


Exercícios 


Seção 2.5 (68-87) 


68. Reconsidere o cenário de cartões de crédito do Exercício 
47 (Seção 2.4) e mostre que A e B são dependentes 
primeiro usando a definição de independência e depois 
demonstrando que não se aplica a regra da multiplicação. 

69; Uma empresa de exploração de petróleo possui dois 

^ projetos ativos, um na Ásia e outro na Europa. Sejam 
por A o evento em que o projeto da Ásia tem sucesso e 
B o evento em que o projeto da Europa tem sucesso. 
Suponha que A t B sejam eventos independentes com 
P(A) = 0.4 e P(B) = 0,7. 

a. Se o projeto da Ásia não obtiver sucesso, qual é a 
probabilidade de o projeto da Europa também não 
obtê-lo? Explique seu raciocínio. 

b. Qual é a probabilidade de pelo v menos um dos dois 

projetos ter sucesso? ü 

c. Dado que pelo ^menos um dos doisjj rojetq s obteve 

sucesso, qual é aprobabil idade de apenas o projeto 
da Ásia ter sucesso? p { U^> Vl 

70. No Exercício 13, há algum A, independente de qualquer 
outro Ajl Responda, usando a propriedade da multipli- 
cação para eventos "independentes. 

71. Se A e B forem eventos independentes, mostre que A' e 
B também são independentes. [ Sugestão : Primeiro de- 
fina a relação entre P(A ' O £), P(B), e P(A H B ).] 

72. Suponha que as proporções de fenótipos sangüíneos em 
uma população sejam as seguintes: 

A B AB O 

0,42 0,10 0,04 0,44 

Assumindo que os fenótipos de dois indivíduos sele- 
cionados aleatoriamente sejam independentes um do 
outro, qual é a probabilidade de que ambos os fenóti- 
pos sejam O? Qual é a probabilidade de que os fenó- 
tipos de dois indivíduos selecionados aleatoriamente 
sejam iguais? 

73. Uma das hipóteses básicas da teoria de gráficos de con- 
trole (consulte o Capítulo 16) é a que pontos locados 
sucessivamente sejam independentes uns dos outros. 
Cada ponto locado indica que o processo de fabricação 
está operando corretamente ou que há algum tipo de 
problema. Mesmo quando o processo está funcionando 
bem, há uma pequena probabilidade de que um deter- 
minado ponto indique um problema no processo. Supo- 
nha que essa probabilidade seja 0,05. Qual é a probabi- 
lidade de que pelo menos um de 10 pontos sucessivos 
indique um problema quando na verdade o processo 
opera corretamente? Responda esta pergunta para 25 
pontos sucessivos. 

74. A probabilidade de um aluno errar a marcação de uma 
pergunta específica num exame de múltipla escolha é 
0,1. Se houver 10 perguntas e elas forem marcadas de 


forma independente, qual é a probabilidade de não ser 
cometido nenhum erro? E de ser cometido pelo menos 
um erro? Se houver n perguntas e a probabilidade de 
um erro de marcação for p em vez de 0,1, forneça ex- 
pressões para as duas probabilidades. 


75. A junta de uma aeronave requer 25 rebites. A junta terá 
que ser refeita se qualquer um dos rebites estiver defeituo- 
so. Suponha que os defeitos dos rebites sejam indepen- 
dentes um do outro e tenham a mesma probabilidade. 

a. Se 20% de todas as juntas tiverem que ser refeitas, 
qual será a probabilidade de um rebite ter defeito? 

b. Quão pequena deve ser a probabilidade de um rebite 
ter defeito para garantir que apenas 10% das juntas 
tenham que ser refeitas? 


76. 






Uma caldeira tem cinco válvulas de alívio idênticas. A 
probabilidade de uma válvula específica ser aberta sob 
demanda é de 0,95. Assumindo operação independente 
das válvulas, calcule P(pelo menos uma válvula é 
aberta) e P(pelo menos uma válvula tem falha ao abrir). 

Duas bombas ligadas em paralelo falham indepen- 
dentemente uma da outra em um determinado dia. A 
probabilidade de que apenas a bomba mais antiga apre- 
sente falha é de 0,10 e a probabilidade de que apenas a 
bomba mais nova o faça é de 0,05. Qual é a probabili- 
dade de que o sistema de bombas apresente uma falha 
em um determinado dia (que acontece se houver fa- 
lha em ambas as bombas)? 

Considere o sistema de componentes ligados como na 
figura a seguir. Os componentes 1 e 2 estão ligados em 
paralelo, de forma que o subsistema funciona se e, so- 
mente se, 1 ou 2 funcionar. Como 3 e 4 estão ligados 
em série, o subsistema funcionará se, e somente se, 3 e 
4 funcionarem. Se os componentes funcionarem inde- 
pendentemente um do outro e ^(componente funciona) 
= 0,9, calcule P(sistema funciona). 



79. Refira-se à configuração de sistema série-paralelo apre- 
sentada no Exemplo 2.35 e suponha que haja apenas 
duas células em vez de três em cada subsistema para- 
lelo [na Figura 2.14(a), elimine as células 3 e 6 e renu- 
mere as células 4 e 5 como 3 e 4]. Usando P(A) = 0,9, 
a probabilidade de que a vida útil do sistema 
exceda t 0 é facilmente vista ser 0,9639. Para que valor 
0,9 teria de ser alterado para aumentar a confiabilidade 
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da vida útil do sistema de 0,9639 para 0.99? ( Sugestão : 
Seja P(A j) = p, expresse a confiabilidade do sistema em 
termos de p e assuma x = p 2 ). 

80. Considere o lançamento independente de dois dados, um 
verde e um vermelho. Sejam A o evento em que o dado 
vermelho mostra 3 pontos, B o evento em que o dado 
verde mostra 4 pontos e C o evento em que o número to- 
tal de pontos mostrados nos dois dados é 7. Esses eventos 
são independentes aos pares (ou seja, A e B são eventos 
independentes, A e C também e B e C também)? Os três 
eventos são mutuamente independentes? 

81. Os componentes que chegam em um distribuidor são 
verificados em busca de defeitos por dois inspetores di- 
ferentes (cada componente é verificado por ambos os 
inspetores). O primeiro inspetor detecta 90% de todos 
os componentes defeituosos, assim como o segundo 
inspetor. Pelo menos um inspetor não detecta 20% de 
todos os componentes defeituosos. Qual é a probabili- 
dade de ocorrência dos itens a seguir? 

a. Um componente com defeito ser detectado ape- 
nas pelo primeiro inspetor? Por exatamente um 
dos inspetores? 

b. Os três componentes defeituosos de um lote pas- 
sarem pelos dois inspetores sem detecção de defeito 
(assumindo que as inspeções de diferentes compo- 
nentes sejam independentes uma da outra)? 

82. Setenta por cento de todos os veículos inspecionados 
em um determinado posto de inspeção de emissões pas- 
sam na inspeção. Assumindo que veículos sucessivos 
passam ou não passam independentemente um do 
outro, calcule as seguintes probabilidades: 

a. P ( os três próximos veículos inspecionados passam) 

b. P(pelo menos um dos três próximos veículos inspe- 
cionados falha) 

c. P(exatamente um dos três próximos veículos inspe- 
cionados passa) 

d. P(no máximo um dos três próximos veículos passa) 

e. Dado que ao menos um dos três próximos veículos 
passa na inspeção, qual é a probabilidade de que to- 
dos os três passem (uma probabilidade condicional)? 

83. Um inspetor de controle de qualidade pesquisa defeitos 
em itens produzidos. O inspetor pesquisa as falhas do 
item numa série de fixações independentes, cada uma 
com duração fixa. Dado que existe uma falha, seja p a 
probabilidade de a falha ser detectada durante qualquer 
fixação (esse modelo é discutido em “Human Perfor- 
mance in Sampling Inspection,” Humcm Factors, 1979, 

р. 99-105). 

a. Assumindo que um item tenha uma falha, qual é a 
probabilidade de ele ser detectado até o final da se- 
gunda fixação (depois da detecção de uma falha, as 
fixações são interrompidas)? 

b. Forneça uma expressão da probabilidade de que uma 
falha será detectada até o final da enésima fixação. 

с. Se, quando uma falha não for detectada em três fixa- 
ções, o item passar, qual será a probabilidade de que 
um item com falha passe na inspeção? 


d. Suponha que 10% de todos os itens contenham uma 
falha [P(item escolhido aleatoriamente apresenta 
falha) = 0,1]. Com a suposição da parte (c), qual é a 
probabilidade de um item com falha passar na ins- 
peção (ele passará automaticamente se não tiver 
falha, mas também pode passar se tiver)? 

e. Dado que um item passou na inspeção (nenhuma 
falha em três fixações), qual é a probabilidade de ele 
possuir uma falha? Calcule para p = 0,5. 


84. a. Uma serraria recebe um lote de 10.000 tábuas 2X4. 
Suponha que 20% dessas tábuas (2.000) na verdade 
estejam muito verdes para serem usadas em cons- 
trução de primeira qualidade. Duas tábuas são sele- 
cionadas aleatoriamente, uma após a outra. Sejam A 
= {a primeira tábua está verde) e B = {a segunda 
tábua está verde). Calcule P(A) % P(B) e P(A fT B) (um 
diagrama de árvore é útil). A e B são independentes? 

b. Com A e B independentes e P(A) = P{B) = 0,2, 
qual é P(A H B)1 Qual é a diferença entre essa 
resposta e P{A f! B) na parte (a)? Para fins de cál- 
culo de P(A H £), podemos assumir que A e B da 
parte (a) sejam independentes para obter unica- 
mente a probabilidade correta? 

c. Suponha que o lote consista em 10 tábuas, das quais 
duas estão verdes. A hipótese de independência 
agora apresenta aproximadamente a resposta correta 
para P(A Pl B)1 Qual é a principal diferença entre a 
situação descrita aqui e a da parte (a) ? Quando você 
considera que a hipótese de independência seria vá- 

/ lida para a obtenção de uma resposta aproximada- 
/ mente correta para P{A H £)? 


o5. Consulte as hipóteses do Exercício 78 e responda à 
‘ ^questão proposta para o sistema da figura abaixo. Como 
a probabilidade mudaria se este fosse um subsistema 
ligado em paralelo ao subsistema ilustrado na Figura 
2.14 (a)? 



86. O professor Stan der Deviation pode usar uma de duas 
rotas em seu caminho de volta do trabalho para casa. 
Na primeira rota, há quatro cruzamentos com ferrovias. 
A probabilidade de ele ter de parar em qualquer um dos 
cruzamentos é 0.1 e os trens operam de forma inde- 
pendente nos quatro cruzamentos. A outra rota é mais 
longa, mas tem apenas dois cruzamentos, indepen- 
dentes um do outro, com a mesma probabilidade de 
parada da primeira rota. Um dia, o professor Deviation 
tem um compromisso em casa com hora marcada. Em 
qualquer rota ele estima que chegará atrasado se for 
parado por trens em pelo menos metade dos cruzamen- 
tos encontrados. 

a. Que rota deve seguir para minimizar a probabilidade 
de chegar atrasado? 
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b. Se jogar uma moeda para decidir que rota tomar e 
chegar atrasado, qual será a probabilidade de ele ter 
usado a rota com quatro cruzamentos? 

87. Suponha que etiquetas idênticas tenham sido coloca- 
das na orelha direita e na esquerda de uma raposa. A 
raposa é libertada por um período de tempo. Consi- 
dere os dois eventos C, = {etiqueta da orelha esquerda 
é perdida) e C 2 = {etiqueta da orelha direita é per- 


dida). Seja 7 r = P(C,) = P(C 2 ) e assuma C, e C 2 como 
eventos independentes. Deduza uma expressão (envol- 
vendo 7 r) para a probabilidade de exatamente uma eti- 
queta ser perdida (“Ear Tag Loss in Red Foxes,” J. 
Wildlife Mgmt., 1976, p. 164-167). ( Sugestão : Dese- 
nhe um diagrama de árvore em que os dois ramos ini- 
ciais refiram-se ao evento etiqueta da orelha esquerda 
é perdida). 


| Exercícios Suplementares (88-1 1 1) 

88. Uma pequena empresa de fabricação começará a operar 
no turno da noite. Há 20 maquinistas empregados. 

a. Se o turno da noite tiver 3 maquinistas, quantas 
equipes podem ser formadas? 

b. Se os maquinistas forem classificados de 1,2, ...» 20 
em ordem de competência, quantas equipes não 
teriam o melhor maquinista? 

c. Quantas equipes teriam pelo menos um dos 10 me- 
lhores maquinistas? 

d. Se uma dessas equipes for selecionada aleatoria- 
mente em uma noite específica, qual é a probabili- 

ydade de o melhor maquinista não trabalhar naquela 
noite? 

4$. Uma empresa usa três linhas de produção para fabricar 
\>- certo tipo de latas. A tabela fornece as porcentagens de 
\ latas fora da conformidade, categorizadas por tipo de 
\não-conformidade, para cada uma das três linhas du- 
rante um período de tempo. 

Linha 1 Linha 2 Unha 3 


Mancha 

15 

12 

20 

Trinca 

50 

44 

40 

Problema em pull-tab 

21 

28 

24 

Defeito na superfície 

10 

8 

15 

Outro 

4 

8 

2 


Durante esse período, a linha 1 produziu 500 latas fora 
de conformidade, a linha 2 produziu 400 e a linha 3, 
600. Suponha que uma dessas 1500 latas seja sele- 
cionada aleatoriamente. 

a. Qual é a probabilidade de ela ter sido produzida pela 
linha 1? E que o motivo da não-conformidade seja 
uma trinca? 

b. Se a lata selecionada tiver vindo da linha 1 , qual é a 
probabilidade de ela ter uma mancha? 

c. Dado que a lata selecionada possui um defeito na 
superfície, qual é a probabilidade de ter vindo da 
linha 1? 

90. Um funcionário do escritório de registros de uma 
universidade possui 10 formulários em sua mesa es- 
perando processamento. Seis deles são petições de 
saída e os outros quatro são solicitações de substituição 
de curso. 


a. Se ele selecionar aleatoriamente seis formulários 
para entregar a um subordinado, qual é a probabi- 
lidade de apenas um dos dois tipos de formulários 
permanecer na mesa ? 

b. Suponha que ele tenha tempo para processar apenas 
quatro desses formulários até o fim do dia. Se esses 
quatro forem selecionados aleatoriamente um a um, 
qual é a probabilidade de que cada formulário su- 
cessivo seja de um tipo diferente de seu predecessor? 

91. Um satélite tem seu lançamento previsto do cabo 
Canaveral, na Flórida, e o outro da Base Aérea de Van- 
denberg. na Califórnia. Sejam A o evento do lança- 
mento de Vandenberg ser feito na data e B o evento 
análogo do cabo Canaveral. S eAefi forem eventos 
independentes com P(A) > P(B) e P(A U B) = 0,626, 
P(A fl B) = 0,144, determine os valores de P{A) 
e P(B). 

92 * Um transmissor está enviando uma mensagem usando 
código binário, ou seja, uma seqüência de 0s e Is. Cada 
bit transmitido (0 ou 1) deve passar por três relés para 
chegar ao receptor. Em cada relé há uma probabilidade 
de 0,20 de que o bit enviado seja feito de forma dife- 
rente do bit recebido (uma reversão). Assuma que os 
relés operem de forma independente um do outro. 

Transmissor — » Relé 1 — » Relé 2 — > Relé 3 

— > Receptor 

a. Se um 1 for enviado pelo transmissor, qual será a pro- 
babilidade de um 1 ser enviado por todos os relés? 

b. Se um 1 for enviado pelo transmissor, qual é a pro- 
babilidade de um 1 ser recebido pelo receptor? ( Su- 
gestão : Os oito resultados experimentais podem ser 
exibidos em um diagrama de árvore com três ge- 
rações de ramos, um para cada relé). 

c. Suponha que 70% de todos os bits enviados do trans- 
missor sejam 1. Se um 1 for recebido pelo receptor, 
qual é a probabilidade de um 1 ter sido enviado ? 

93. O indivíduo A tem um círculo de cinco amigos íntimos 
(B, C, D, E e F). A ouviu um boato de fora do círculo e 
convidou os cinco amigos para uma festa para transmi- 
tir o boato. Para iniciar, A seleciona um dos cinco 
aleatoriamente e conta o boato para ele. Esse indivíduo 
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então seleciona um dos quatro restantes e repete o que 
ouviu. Continuando, uma nova pessoa é selecionada 
dentre os que não ouviram o boato e assim sucessiva- 
mente até que todos saibam. 

a. Qual é a probabilidade de o boato ser repetido na or- 
dem B, C, D, E e F? 

b. Qual é a probabilidade de F ser a terceira pessoa a 
saber do boato? 

c. Qual é a probabilidade de F ser a última pessoa a ou- 
vir o boato? 

94 . Refira-se ao Exercício 93. Se em cada etapa a pessoa 
que “tem’' o boato no momento não souber quem já ou- 
viu e selecionar o próximo receptor aleatoriamente den- 
tre as cinco possibilidades, qual é a probabilidade de F 
ainda não ter ouvido o boato depois ter sido contado 10 
vezes na festa? 

95 . Um engenheiro químico está interessado em determinar 
se traços de certa impureza estão presentes em um pro- 
duto. Um experimento tem probabilidade 0,80 de de- 
tectar a presença da impureza. A probabilidade de não 
detectar a impureza se ela não estiver presente é de 
0,90. As probabilidades anteriores de a impureza estar 
presente e estar ausente são de 0,40 e 0,60, respecti- 
vamente. Três experimentos separados resultam em 
apenas duas detecções. Qual é a probabilidade posterior 
de a impureza estar presente? 

96 . Cada competidor de um programa de perguntas e res- 
postas é solicitado a especificar uma de seis possíveis 
categorias que servirão de tema para as perguntas feitas. 
Suponha que P (competidor escolhe a categoria 0 = £ e 
os competidores sucessivos escolham suas categorias 
independentemente um do outro. Se houver três com- 
petidores em cada programa e os três escolherem 
categorias diferentes, qual é a probabilidade de que exa- 
tamente um tenha selecionado a categoria 1 ? 

97 . Os fixadores usados na fabricação de aviões são ligei- 
ramente tortos para evitar afrouxarem com a vibração. 
Suponha que 95% de todos os fixadores passem na ins- 
peção inicial. Dos 5% com falhas, 20% possuem de- 
feitos tão sérios que devem ser sucateados. Os fixadores 
restantes são enviados para retrabalho, onde 40% não 
podem ser salvos e são descartados. Os outros 60% são 
corrigidos pelo processo de ondulação e, depois, pas- 
sam na inspeção. 

a. Qual é a probabilidade de um fixador selecionado 
aleatoriamente passar na inspeção inicialmente ou 
após o retrabalho? 

b. Dado que um fixador tenha passado na inspeção, 
qual é a probabilidade de ele ter passado na ins- 
peção inicial e não ter precisado de retrabalho? 

98 . Um por cento de todos os indivíduos de certa po- 
pulação são portadores de determinada doença. Um 
teste de diagnóstico para essa doença tem taxa de de- 
tecção de 90% para portadores e 5% para não-porta- 
dores . Suponha que o teste seja aplicado independen- 


temente a duas amostras de sangue do mesmo indiví- 
duo selecionado aleatoriamente. 

a. Qual é a probabilidade de ambos os testes terem o 
mesmo resultado? 

b. Se ambos os testes forem positivos, qual será 
a probabilidade de o indivíduo selecionado ser 
um portador? 

99 . Um sistema consiste em dois componentes. A proba- 
bilidade de o segundo componente funcionar de forma 
satisfatória durante a vida útil do projeto é 0,9, a 
probabilidade de pelo menos um dos dois componentes 
funcionar é de 0,96 e a de ambos os componentes fun- 
cionarem é de 0,75. Dado que o primeiro componente 
funciona de forma satisfatória por toda a vida útil do 
projeto, qual é a probabilidade de o segundo tam- 
bém funcionar? 

100 . Certa empresa envia 40% de sua correspondência ex- 
pressa noturna pelo serviço expresso £,. Dessa s 
remessas, 2% chegam após a hora de entrega garantida 
(represente o evento “entrega atrasada” por L). Se um 
registro de um envio expresso noturno for selecionado 
aleatoriamente no arquivo da empresa, qual será a 
probabilidade de a remessa ter sido enviada via £, e 
estar atrasada? 

101 . Refira-se ao Exercício 100. Suponha que 50% das 
remessas expressas sejam enviadas via serviço expresso 
E 2 e as 10% restantes sejam enviadas por £ 3 . Dos en- 
viados por E 2 , apenas 1 % chega com atraso, enquanto 
5% das parcelas enviadas por £ 3 chegam com atraso. 

a. Qual é a probabilidade de uma parcela selecionada 
aleatoriamente chegar com atraso? 

b. Se uma parcela selecionada aleatoriamente chegar 
no horário, qual será a probabilidade de ela não ter 
sido enviada por £,? 

102 . Uma empresa usa três linhas de montagem diferentes: 
A | , A 2 e A 3 para fabricar certo componente. Dos compo- 
nentes fabricados pela linha A„ 5% exigem retrabalho 
para corrigir um defeito, enquanto 8% dos componentes 
da linha A 2 exigem retrabalho, assim como 10% de A 3 . 
Suponha que 50% de todos os componentes sejam pro- 
duzidos pela linha A,, 30% por A 2 e 20% por A 3 . Se um 
componente selecionado aleatoriamente exigir retra- 
balho, qual será a probabilidade de ele ser proveniente 
da linha A,? Da linha A 2 ? E da linha A 3 ? 

103 . Desprezando a possibilidade de aniversário no dia 29 
de fevereiro, suponha que um indivíduo selecionado 
aleatoriamente tenha iguais probabilidades de ter 
nascido em qualquer um dos outros 365 dias. 

a. Se 10 pessoas forem selecionadas aleatoriamente, 
qual será. a probabilidade de todas terem datas de 
aniversário diferentes? Que ao menos duas tenham 
a mesma data de aniversário? 

b. Com k no lugar de 10 na parte (a), qual é o menor 
k para o qual há possibilidade de 50% de duas ou 
mais pessoas terem a mesma data de aniversário? 
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c. Se 10 pessoas forem selecionadas aleatoriamente, 
qual será a probabilidade de que pelo menos duas 
tenham a mesma data de aniversário ou que pelo 
menos duas tenham os mesmos três últimos dígitos 
do número de seguro social (ao todo são 9 dígitos)? 
[Nota: O artigo “Methods for Studying Coinci- 
dences” (F. Mosteller and P. Diaconis, J. Amer. Stat. 
Assoe., 1989, p. 853-861) discute problemas desse 
tipo]. 

104 . Um método usado para distinguir rochas graníticas 
(G) e basálticas ( B ) é examinar uma parte do espectro 
infravermelho da energia solar refletida na superfície 
da rocha. Sejam R h R 2 e R) as intensidades de espectro 
medidas em três diferentes comprimentos de onda. 
Normalmente, para granito. /?, < R 2 < /?,, enquanto 
para basalto /?,</?,< R 2 . Quando as medidas são 
feitas de forma remota (usando aeronaves), podem 
surgir diversas ordenações de R,s, se a rocha for ba- 
salto ou granito. Vôos sobre regiões de composição 
conhecida resultaram nas seguintes informações: 


Granito Basalto 

/?,</?,< J?3 60% 10% 

/?, < R 3 < R 2 25% 20% 

/? 3 <R } <R 2 15% 70% 


Suponha que, para uma rocha selecionada aleatoria- 
mente em determinada região, P(granito) = 0,25 e 
P(basalto) = 0,75. 

a. Mostre que Pígranito | /?, < R 2 < /?,) > P(basalto | 
R\ < R 2 < Rh). Se as medidas forneceram /?, < 
R 2 < /? 3 , você classificaria a rocha como granito ou 
como basalto? 

b. Se as medidas forneceram /?,</?*< R 2 , como 
você classificaria a rocha? Responda à mesma 
questão para /? 3 < /?, < R 2 . 

c. Usando as regras de classificação indicadas nas 
partes (a) e (b), ao selecionar uma rocha dessa re- 
gião, qual é a probabilidade de uma classificação 
errada? [Sugestão: G pode ser classificado como B 
ou B como C e P(B ) e P(G) são conhecidos]. 

d. Se P(granito) = p em vez de 0,25, há valores de p 
(diferentes de 1 ) para os quais uma pessoa sempre 
classificaria uma rocha como granito? 

105. Uma seqüência de vislumbres é fornecida para que um 
alvo possa ser detectado. Seja G, = (o alvo é detectado 
noenésimo vislumbre), com p, = P(G t ). Suponha que 
os G,s sejam eventos independentes e escreva uma ex- 
pressão da probabilidade de que o alvo foi detectado 
no final do enésimo vislumbre. (Nota: Esse modelo é 
discutido em “Predicting Aircraft Detectability,” Hu- 
man Factors , 1979, p. 277-291.) 

106. Num jogo de beisebol da Liga Pequena, o lançador do 
time A lança strikes em 50% das vezes e lança hall 
(bolas ruins) 50% das vezes, os arremessos são inde- 


pendentes um do outro e o lançador nunca atinge o 
rebatedor. Sabendo disso, o treinador do time B ins- 
truiu o rebatedor para não rebater nunca. Calcule a 
probabilidade de 

a. o rebatedor ganhar a base no quarto arremesso (4 
balis consecutivos); 

b. o rebatedor ganhar a base no sexto arremesso (de 
forma que dois dos cinco primeiros devem ter sido 
strikes) usando um argumento de contagem ou 
construindo um diagrama de árvore; 

c. o rebatedor ganhar a base (4 balis antes de 
3 strikes ); 

d. o primeiro rebatedor marcar sem ninguém ter sido 
eliminado (assumindo que cada rebatedor use a es- 
tratégia de não rebater). 

107 . Quatro engenheiros. A, B, C e D, tiveram entrevistas 
marcadas para as 10 da manhã na sexta-feira, 13 de ja- 
neiro, na Random Sampling, Inc. O gerente de RH 
marcou as quatro entrevistas para as salas 1, 2, 3 e 4, 
respectivamente. Entretanto, a secretária do gerente 
não sabe disso e os manda a quatro salas, de forma to- 
talmente aleatória (o que mais a fazer!). Qual é a pro- 
babilidade de: 

a. Os quatro acabarem nas salas certas? 

b. Nenhum dos quatro ir para a sala certa? 

108 . Determinada companhia aérea tem vôos às 10 da 
manhã de Chicago para Nova York, Atlanta e Los An- 
geles. Seja A o evento em que o voo para Nova York 
está cheio e defina os eventos B e C de forma análoga 
para os outros vôos. Suponha que P(A) = 0,6, P(B) = 
0,5, P(Q = 0,4 e que os três eventos sejam indepen- 
dentes. Qual é a probabilidade de: 

a. Os três vôos estarem cheios? Ao menos um dos 
vôos não estar cheio? 

b. Apenas o voo para Nova York estar cheio? Exata- 
mente um dos três vôos estar cheio? 

109 . Um gerente de pessoal entrevistará quatro candi- 
datos a um carço. Eles estão classificados como 1, 2, 3 
e 4, em ordem de preferência, e serão entrevistados em 
ordem aleatória. Entretanto, no final de cada entrevista, 
o gerente saberá apenas como o candidato atual se com- 
para em relação aos candidatos já entrevistados. Por 
exemplo: a ordem de entrevistas 3, 4, 1,2 não fornece 
informações após a primeira entrevista, mostra que o se- 
gundo candidato é pior que o primeiro e que o terceiro 
é melhor que os dois primeiros. Entretanto, a ordem 3, 
4, 2, 1 geraria as mesmas informações após cada uma 
das três primeiras entrevistas. O gerente deseja contratar 
o melhor candidato, mas deve tomar uma decisão ir- 
revogável após cada entrevista. Considere a estratégia a 
seguir rejeitar automaticamente os primeiros s can- 
didatos e então contratar o primeiro candidato subse- 
qüente que é o melhor dentre os entrevistados (se não 
houver tal candidato, contratar o último entrevistado). 

Por exemplo, com s = 2, a ordem 3,4, 1,2 resul- 
taria na contratação do melhor candidato, enquanto a 
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ordem 3, 1, 2, 4 não o faria. Dos quatro valores pos- 
síveis (0, 1, 2 e 3), qual maximiza P (contratação do 
melhor)? ( Sugestão : Escreva as 24 ordens de igual 
probabilidade: 5 = 0 significa que o primeiro can- 
didato é contratado automaticamente). 

110 . Considere quatro eventos independentes A„ A 2 , A 3 e A 4 
e seja p, = P(A,) para i = 1, 2, 3, 4. Expresse a proba- 
bilidade de que pelo menos um desses quatro eventos 
ocorra em termos dos p,-s e faça o mesmo para a pro- 
babilidade de que pelo menos dois eventos ocorram. 


111 . Uma caixa contém quatro pedaços de papel exata- 
mente de mesmas dimensões: (1) ganha o prêmio 1; 
(2) ganha o prêmio 2, (3) ganha o prêmio 3 e (4) ganha 
os prêmios 1, 2 e 3. Um pedaço é selecionado aleato- 
riamente. Seja A, = {ganha o prêmio 1 } ; A 2 = {ganha 
o prêmio 2 } e A 3 = { ganha o prêmio 3 }. Mostre que A, 
e A 2 são independentes, que A, e A 2 são independentes, 
assim como A 2 e A 3 (isso é independência aos pares). 
Mostre, entretanto, que P(A, flA 2 n A 3 ) P(A,) • 

P(A 2 ) • P(A 3 ), de forma que esses eventos não sejam 
mutuamente independentes. 


I Bibliografia 

DURRETT, Richard. The Essentials of Prohability. Duxbury 
Press, Belmont, CA. 1993. Uma apresentação concisa, 
em um nível ligeiramente superior ao deste livro. 

MOSTELLER, Frederick, ROURKE, Robert e THOMAS, 
George, Probability mth Statistical Applications (2 a 
ed.), Addison-Wesley, Reading, MA, 1970. Uma intro- 
dução muito boa à probabilidade, com muitos exemplos 
divertidos; bom especialmente em regras de contagem e 
suas aplicações. 

OLKIN, Ingram, DERMAN, Cyrus e GLESER, Leon, 
Probability Models and Application (2 a ed.), Macmil- 


lan, Nova York, 1994. Uma abrangente introdução à 
probabilidade, escrita em um nível ligeiramente mais 
difícil do que o deste livro, mas com muitos exem- 
plos interessantes. 

ROSS, Sheldon, A First Course in Probability (6 a ed.), 
Macmillan, Nova York, 2002. De leitura mais difícil e 
mais sofisticado matematicamente, esse livro contém 
muitos exemplos e exercícios interessantes. 

WINKLER, Robert, Introduction to Bayesican lnference 
and Decision, Holt, Rinehart & Winston. Nova York. 
1972. Excelente introdução à probabilidade subjetiva. 


3 

Variáveis Aleatórias 
Discretas e Distribuições 
de Probabilidade 


Introdução 

Independentemente de um experimento gerar resultados quantitativos ou qualitativos, os 
métodos de análise estatística requerem que sejam enfocados certos aspectos numéricos 
dos dados (como proporção de amostra x/n, média x ou desvio padrão s). 0 conceito de 
variável aleatória nos permite passar dos resultados do experimento propriamente ditos 
para uma função numérica dos resultados. Há dois tipos fundamentalmente diferentes de 
variáveis aleatórias: variáveis aleatórias discretas e variáveis aleatórias contínuas. Neste 
capítulo examinaremos as propriedades básicas e discutiremos os exemplos mais impor- 
tantes das variáveis discretas. O Capítulo 4 enfocará as variáveis aleatórias contínuas. 


3.1 


Variáveis Aleatórias 


Em qualquer experimento há diversas características que podem ser observadas ou medidas, mas na maioria dos 
casos o experimento enfocará um ou alguns aspectos específicos da amostra. Por exemplo: em um estudo de 
padrões de transporte de uma área metropolitana, cada indivíduo pode ser consultado sobre distância, sobre o 
número de pessoas que usam o mesmo veículo, mas não sobre o Ql, renda, tamanho da família e outras carac- 
terísticas do tipo. Como alternativa, um pesquisador pode testar uma amostra de componentes e registrar apenas 
quantos apresentaram falhas dentro de mil horas, em vez de manter o registro das falhas individuais. 

Em geral, cada resultado de um experimento é associado a um número, especificando-se uma regra de as- 
sociação (por exemplo: a quantidade de componentes que apresentam falha em um período de mil horas em uma 
amostra de 10 componentes ou o peso total de bagagem para uma amostra de 25 passageiros de uma companhia 
aérea). Tal regra de associação é denominada variável aleatória. Variável porque é possível obter diferentes va- 
lores numéricos, e aleatória porque o valor observado depende de qual dos resultados possíveis do experimento 
é obtido (Veja a Figura 3.1). 
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Figura 3.1 Uma variável aleatória 


DEFINIÇÃO 


Para um dado espaço amostrai S de um experimento, uma variável aleatória (va) é qual- 
quer regra que associe um valor a cada resultado de S. Em termos matemáticos, uma va- 
riável aleatória é uma função cujo domínio é o espaço amostrai e o contra-domínio é um 
conjunto de números reais. 


As variáveis aleatórias normalmente são representadas por letras maiusculas, como X e Y, próximas ao fi- 
nal do alfabeto. Em contraste com a utilização anterior de uma letra maiuscula, como X , para representar uma 
variável, usaremos letras minúsculas para representar um valor específico da variável aleatória correspondente. 
A notação X(s) = x significa que jc é o valor associado ao resultado s pela va X. 

Exemplo 3.1 

Quando um estudante tenta acessar um computador em um sistema de compartilhamento de tempo, todas as por- 
tas estão ocupadas (F), caso em que o aluno não terá sucesso, ou haverá ao menos uma porta livre (5), caso em 
que o estudante conseguirá acessar o sistema. Com S = {5, F }, defina uma va X como 

X(S) = 1 X(F) = 0 

A va X indica se o estudante pode (1) ou não (0) acessá-lo. ■ 

No Exemplo 3.1, a va X foi especificada, relacionando-se explicitamente cada elemento de S e o núme- 
ro associado. Se S tiver muitos resultados, a tarefa levará muito tempo para ser feita, mas pode ser omitida 
freqüentemente. 

Exemplo 3.2 

Considere o experimento em que um número de telefone em um determinado código de área é discado por meio 
de discador aleatório (dispositivos muito usados por empresas de pesquisa) e defina uma va Y como 

1 se o número selecionado não estiver na lista telefônica 
0 se o número selecionado estiver na lista telefônica 



Por exemplo: se 5528-2966 estiver na lista telefônica — ^(55528-2966) = 0 — enquanto K(77772-7350) 
= 1 nos diz que o número 7772-7350 não está na lista. A descrição desse tipo de evento em palavras é mais 
econômica do que uma listagem completa, de forma que a usaremos sempre que possível. ■ 


Nos exemplos 3.1 e 3.2, os únicos valores possíveis da variável aleatória eram 0 e 1. Tais variáveis 
aleatórias aparecem tão frequentemente que receberam um nome especial em homenagem ao primeiro indivíduo 
que as estudou. 


DEFINIÇÃO 


Qualquer variável aleatória cujos únicos valores possíveis são 0 e 1 é denominada 

Variável Aleatória de Bernoulli. 


Freqüentemente, precisamos definir e estudar diversas variáveis aleatórias diferentes do mesmo espaço amostrai. 
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Exemplo 3.3 

O Exemplo 2.3 descreveu um experimento no qual foi determinado o número de bombas em uso de dois postos 
de gasolina. Defina as vas X, Y e U por 

X = o número total de bombas em uso nos dois postos 

Y = a diferença entre o número de bombas em uso no posto 1 e o número em uso no posto 2 
U = o máximo de bombas em uso nos dois postos 

Se o experimento for realizado e o resultado for s = (2, 3), então X((2, 3)) = 2 + 3 = 5, podendo-se dizer 
que o valor observado de X foi x = 5. De forma similar, o valor observado de Y seria y = 2 — 3 = — leo valor 
observado de U seria u = máx.(2, 3) = 3. ■ 

Cada variável aleatória dos exemplos 3. 1-3.3 pode assumir apenas um número finito de valores possíveis. 
Esse não é obrigatoriamente o caso. 

Exemplo 3.4 

No Exemplo 2.4, consideramos o experimento em que diversas baterias eram examinadas até a obtenção de uma 
em bom estado (S). O espaço amostrai foi <f = {S, FS, FFS, . . .}. Defina uma va X como 

X = o número de baterias examinadas antes do fim do experimento 

Então X(S) = 1, X(FS) = 2, X(FFS) = 3, . . . , X(FFFFFFS) = 7 e assim por diante. Qualquer inteiro po- 
sitivo é um valor possível de X, de modo que o conjunto de valores possíveis é infinito. ■ 

Exemplo 3.5 

Suponha que um local (latitude e longitude) nos Estados Unidos continental seja selecionado de forma aleatória. 
Defina uma va Y por 

Y = a altura acima do nível do mar do local selecionado 

Por exemplo: se o local selecionado foi (39°50'N, 98°35'0), podemos ter K((39 o 50'N, 98°35'0)) = 
1748,26 pés. O maior valor possível de Y é 14.494 pés (monte Whitney) e o menor valor possível é -282 pés 
(Vale da Morte). O conjunto de todos os valores possíveis de Y é o conjunto de todos os números no intervalo 
entre -282 e 14.494, isto é, 

{y: y é um número, -282 14.494) 

e há um número infinito de valores nesse intervalo. ■ 


Dois tipos de variáveis aleatórias 

Na Seção 1.2 foi feita uma distinção entre dois tipos de variáveis numéricas, as discretas e as contínuas. A 
mesma distinção é feita para as variáveis aleatórias. 


DEFINIÇÃO 


Uma variável aleatória discreta é uma variável, cujos valores possíveis constituem um 
conjunto finito ou podem ser relacionados em uma seqüência infinita na qual haja um 
primeiro elemento, um segundo e assim por diante. Uma variável aleatória é contínua se 
seu conjunto de valores possíveis consiste em um intervalo completo da reta de números 
(Reta Real). 


Apesar de qualquer intervalo da reta de números conter um número infinito de valores, podemos demons- 
trar que não há uma forma de criarmos uma lista infinita de todos esses valores, pois há muitos deles. 
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Exemplo 3.6 

Todas as variáveis aleatórias mostradas nos Exemplos 3. 1-3.4 são discretas. Como outro exemplo, suponha que 
selecionemos casais aleatoriamente e façamos um teste sangüíneo em cada pessoa, até encontrarmos um marido 
e mulher com o mesmo fator Rh. Sendo X = o número de testes sangüíneos a serem realizados, os valores pos- 
síveis de X são D = {2, 4, 6, 8, . . .}. Como os valores possíveis foram relacionados em seqüência, X é uma 
va discreta. ■ 

Para estudar as propriedades básicas das vas discretas, são requeridas apenas as ferramentas da matemática 
discreta: soma e subtração. O estudo das variáveis contínuas requer a matemática contínua do cálculo: integrais 
e derivadas. 


Exercícios 1 Seção 3.1 (1-10) 

1. Uma viga de concreto pode apresentar falha por cisa- 
Ihamento (C) ou flexão (F). Suponha que três vigas com 
defeito sejam selecionadas aleatoriamente e o tipo de 
falha seja determinado para cada uma delas. Seja X = 
número de vigas entre as três selecionadas que falharam 
por cisalhamento. Relacione cada resultado no espaço 
amostrai juntamente com o valor de X associado. 

2. Dê três exemplos de va de Bemoulli (diferentes dos 
do livro). 

3. Usando o experimento do Exemplo 3.3. defina mais 
duas variáveis aleatórias e relacione os valores pos- 
síveis de cada uma. 

4. Seja X = número de dígitos não-nulos de um código 
CEP selecionado aleatoriamente. Quais são os valores 
possíveis de XI Forneça três resultados possíveis e seus 
valores associados X. 

5. Se o espaço amostrai é um conjunto infinito, implica 
necessariamente que qualquer va X definida em S terá 
um conjunto infinito de valores possíveis? Caso a res- 
posta seja sim, explique o porquê. Caso contrário, dê 
um exemplo. 

6. A partir de certo horário fixo, cada carro que cruza uma 
interseção é observado para obtenção de sua direção: à 
esquerda (£), à direita (D) ou segue em frente (F). O ex- 
perimento termina assim que um carro vira à esquerda. 
Seja X = o número de carros observados. Quais são os 
valores possíveis de X? Relacione cinco resultados e 
seus valores associados X. 

7. Para cada variável aleatória definida a seguir, descreva 
o conjunto de valores possíveis da variável e diga se 
é discreta. 

a. X = número de ovos não quebrados em uma caixa 
de ovos padrão selecionada aleatoriamente 

b. Y = número de estudantes ausentes no primeiro dia 
de aula em uma lista de chamada de um determinado 
curso 

c. U = número de vezes que um jogador balança o 
taco de golfe antes de atingir a bola 


d. X = comprimento de uma cascavel selecionada 
aleatoriamente 

e. Z = quantia ganha em royalties pela venda de uma 
primeira edição de 10.000 livros-texto 

f. Y = pH de uma amostra de solo selecionada aleato- 
riamente 

g. X = tensão (psi) no encordoamento de uma raquete 
de tênis selecionada aleatoriamente 

h. X = número total de lançamentos de moeda exigi- 
dos para que três indivíduos obtenham resultados 
iguais (cara, cara , cara ou coroa , coroa , coroa) 

8. Cada vez que um componente é testado, o teste resulta 
em sucesso (S) ou falha (F). Suponha que o compo- 
nente seja testado repetidamente até que ocorra sucesso 
em três tentativas consecutivas. Seja Y o número de ten- 
tativas necessárias para atingir esse objetivo. Relacione 
todos os resultados correspondentes aos cinco menores 
valores de Y e diga que valor de Y está associado a 
cada um. 

9. Um indivíduo chamado Claudius está localizado no 
ponto 0 do diagrama a seguir. 


#2 ^3 
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Usando um dispositivo de aleatoriedade adequado (como 
um dado tetraédrico, com quatro lados), Claudius 
primeiro vai para um dos quatro locais Z? : , Z? 3 , # 4 . Uma 
vez que ele esteja em um desses locais, outro dispositivo 
aleatório é usado para decidir se ele deve retomar a 0 ou 
visitar um dos dois outros pontos adjacentes. O processo 
continua; após cada movimento, outro movimento para 
um dos (novos) pontos adjacentes é determinado pelo 
lançamento do dado ou moeda apropriado. 
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a. Seja X = número de movimentos que Claudius faz 
antes de retomar a 0. Quais são os valores possíveis 
de XI X é discreta ou contínua? 

b. Se forem permitidos movimentos ao longo da dia- 
gonal ligando 0aA„ A ly A 3 e A 4 , respectivamente, 
responda às perguntas da parte (a). 

10. O número de bombas em uso em dois postos de gaso- 
lina, um com seis bombas e outro com quatro, será de- 


terminado. Forneça os valores possíveis de cada uma 

das variáveis aleatórias a seguir: 

a. T = número total de bombas em uso 

b. X = diferença entre as quantidades em uso nos pos- 
tos 1 e 2 

c. U = número máximo de bombas em uso em 
cada posto 

d. Z = número de postos com exatamente duas bom- 
bas em uso 


3.2 


Distribuições de Probabilidade para Variáveis 
Aleatórias Discretas 


Quando são atribuídas probabilidades a diversos resultados de 8, elas. por sua vez. determinam probabilidades 
associadas aos valores de qualquer va X em particular. A distribuição de probabilidade de X expressa como a 
probabilidade total 1 é distribuída (alocada a) entre os diversos valores possíveis de X. 

Exemplo 3.7 

Seis lotes de componentes estão prontos para embarque em um fornecedor. O número de componentes com de- 
feito em cada lote é mostrado a seguir: 


Lote 1 2 3 4 5 6 

Número de peças com defeito 0 2 0 1 2 0 


Um desses lotes será selecionado aleatoriamente para embarque a um cliente específico. Seja X o número 
de peças com defeito no lote selecionado. Os três valores possíveis de X são 0, 1 e 2. Dos seis eventos igual- 
mente prováveis, três resultam em X = 0, um em X = 1 e os outros dois em X = 2. Sejam p( 0) a probabilidade 
de X = 0 e p( 1 ) e p(2) as probabilidades dos outros dois valores possíveis de X. Então 

3 

p(0) = P(X = 0) = P(lote 1 ou 3 ou 6 é enviado) = — = 0,500 

6 

p(l) = P(X = 1) = P(lote 4 é enviado) = ?- = 0.167 

6 

p( 2) = P(X = 2) = Pilote 2 ou 5 é enviado) — \ — 0,333 

6 

Ou seja, a probabilidade 0,500 é atribuída para o valor 0 de X, a probabilidade 0, 167 é alocada para o valor 
1 de X e a probabilidade restante, 0,333, é associada ao valor 2 de X. Os valores de X juntamente com suas pro- 
babilidades especificam coletivamente a distribuição de probabilidade ou função de massa da probabilidade de 
X. Se o experimento fosse repetido diversas vezes no longo prazo, X = 0 ocorreria na metade das vezes, X = 1 
em um sexto das vezes e X = 2 em um terço das vezes. ■ 


DEFINIÇÃO 


A função distribuição de probabilidade ou função de massa de probabilidade (fmp) 
de uma va discreta é definida para cada número x por p(x) = P(X = x) = P ( todos os s E 8: 
X(s) = x).' 


P(X = x ) lê-se “a probabilidade de a va X assumir o valor jT. For exemplo: P(X = 2) indica a probabilidade de que o valor resultante de X seja 2. 
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Expondo em palavras, para cada valor possível x da variável aleatória, a fmp especifica a probabilidade de 
observar aquele valor quando o experimento for realizado. As condições p(x) >0e pokívcsPC*) = 1 são 

obrigatórias para qualquer fmp. 

Exemplo 3.8 

Suponha que visitemos a livraria de uma universidade durante a primeira semana de aulas, e observemos se a 
próxima pessoa a comprar um computador comprará um laptop ou um desktop. Seja 


Considere um grupo de cinco doadores de sangue potenciais: A, B, C, D e E. Desses, apenas A e B possuem o 
tipo 0+ . Cinco amostras de sangue, uma de cada indivíduo, serão testadas em ordem aleatória até que seja iden- 
tificado um indivíduo 0+. Seja a va Y = número de testes necessários para identificar um indivíduo 0+. Então 
a fmp de Y é 



í 1 se o cliente comprar um laptop 
(O se o cliente comprar um desktop 


Se 20% de todos os compradores durante aquela semana selecionarem um laptop, a fmp de X será 


p{ 0) = P(X = 0) = P(próximo cliente compra um desktop) = 0,8 
pi\) — P(X = 1) = P( próximo cliente compra um laptop) = 0,2 
p(x) = P(X = x) = 0 para x # 0 ou 1 


Uma descrição equivalente é 


0,8 se x = 0 
p(x) = 0,2 se .* = 1 

0,0 se x ^ 0 ou 1 


A Figura 3.2 é uma ilustração dessa fmp, denominada gráfico de linhas. 



o 


Figura 3.2 0 gráfico de linhas da fmp do Exemplo 3.8 


Exemplo 3.9 


p( 1 ) = P(Y — 1) = P(A ou B identificados primeiro) = -j = 0,4 


p( 2) = P(Y = 2) = P( C, D, ou E primeiro e então A ou B) 


4 


p( 3) = P(Y = 3) = P(C, D, ou E primeiro e segundo, então A ou B) 
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p{ 4) = P(Y = 4) = P(C, D, e E, todos feitos primeiro) = | y ^ ~ j = 0,1 

p(y) = o sey ^ 1, 2, 3, 4 

A fmp pode ser melhor apresentada na forma tabular: 


y 

1 2 

3 

4 

piy) 

0,4 0,3 

0,2 

0,1 


onde qualquer valor y não-relacionado recebe probabilidade zero. Essa fmp também pode ser exibida em um grá- 
fico de linhas (Veja a Figura 3.3). 


POO 
0,5 - 


0 12 3 4 

Figura 3.3 0 gráfico de linhas da fmp do Exemplo 3.9 ■ 

0 nome “função de massa de probabilidade" é sugerido por um modelo usado em física para um sistema 
de “pontos de massa”. Nesse modelo, as massas são distribuídas nos diversos locais x ao longo de um eixo uni- 
dimensional. Nossa fmp descreve como a massa total das probabilidades igual a 1 é distribuída nos diversos pon- 
tos ao longo dos eixos dos possíveis valores da variável aleatória (onde e quanto de massa em cada jc). 

Outra representação ilustrativa útil de uma fmp, denominada histograma de probabilidades, é similar ao his- 
tograma descrito no Capítulo 1. Acima de cada y com p(y) > 0, construa um retângulo centrado em y. A altura 
de cada retângulo é proporcional a p(y) e a base é a mesma para todos os retângulos. Quando os valores pos- 
síveis estão igualmente espaçados, a base é freqüentemente escolhida como sendo a distância entre os valores 
sucessivos de y (apesar de poder ser menor). A Figura 3.4 mostra dois histogramas de probabilidades. 




■ 

■ 


o 


1 



(a) (b) 

Figura 3.4 Histogramas de probabilidade: (a) Exemplo 3.8; (b) Exemplo 3.9 


Parâmetro de uma distribuição de probabilidades 

No Exemplo 3.8, tínhamos p( 0) = 0,8 e p(l) = 0,2 porque 20% de todos os compradores selecionaram com- 
putadores portáteis. Em outra livraria, pode ocorrer que p(0) = 0,9 e p(l) = 0,1. De forma mais geral, a fmp de 
qualquer va Bemoulli pode ser expressa na forma p(l) = a e p{ 0) = 1 — a, onde 0 < a < 1. Como a fmp de- 
pende do valor específico de a, normalmente escrevemos p(x\ a) em vez de apenas p(x): 


p(x-, a) = 


1 — a se x = 0 
a se x = 1 

0 caso contrário 


(3.1) 


Cada escolha de a na Expressão (3.1) resulta em uma fmp diferente. 
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DEFINIÇÃO 


Suponha que p(x) dependa de uma quantidade que pode ser atribuída a qualquer um de di- 
versos valores possíveis, em que cada valor diferente define uma distribuição de probabi- 
lidade diferente. Tal quantidade é denominada parâmetro da distribuição. A coleção de 
todas as distribuições de probabilidade dos diferentes valores do parâmetro é denominada 
uma família de distribuições de probabilidade. 


A quantidade a da Expressão (3.1) é um parâmetro. Cada número a entre 0 e 1 determina um membro 
diferente de uma família para distribuições. Dois desses membros são 


p(x\ 0,6) = 


0,4 se x = 0 
0,6 se x = 1 
0 caso contrário 


e 


p{x ; 0,5) 


0,5 se x = 0 
0,5 se x = 1 
0 caso contrário 


Cada distribuição de probabilidade de uma va Bemoulli tem a forma da Expressão (3.1), denominada a 
família de distribuições de Bemoulli. 

Exemplo 3.10 

Iniciando em um horário fixo, observamos o sexo de cada criança nascida em um determinado hospital até que 
nasça um menino (B). Seja p = P(B), assuma que nascimentos sucessivos sejam independentes e defina a va 
como X = número de nascimentos observados. Então 

p(l) = P(X= l) = P(B)=p 

p(2) = P(X = 2) = P(GB) = P(G) • P(B) = (1 - p)p 


e 

p( 3) = P(X = 3) = P(GGB) = P(G) • P(G) • P(B) = (1 - pfp 
Continuando dessa forma, define-se a fórmula geral: 


p(x) = 


(1 - pY~'p 
0 


x = 1, 2, 3, . . . 
caso contrário 


(3.2) 


A quantidade p na Expressão (3.2) representa um número entre 0 e 1 e é um parâmetro da distribuição de 
probabilidades. No exemplo do sexo das crianças, p = 0,5 1 pode ser apropriado, mas, se estivermos buscando a 
primeira criança com sangue com fator Rh positivo, podemos assumir p = 0,85. ■ 


A função distribuição acumulada 

Para um valor fixo x, normalmente desejamos computar a probabilidade de o valor observado de X ser no má- 
ximo x. Por exemplo: a fmp do Exemplo 3.7 foi 


P(x) = 


0,500 x = 0 
0,167 x=\ 

0,333 x = 2 
0 caso contrário 


A probabilidade de X ser no máximo 1 é então 


P{X< 1) = p( 0) + p(l) = 0,500 + 0,167 = 0,667 
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Nesse exemplo, X < 1 ,5 se e somente se X ^ 1 , de forma que P{X ^ 1,5) = P(X < 1) = 0,667. De forma 
similar, P(X s0) = P(X = 0) = 0,5, e P(X ^ 0,75) = 0,5 também. Como 0 é o menor valor possível de X, 
P(X < -1,7) = 0, P(X < -0.0001) = 0e assim por diante. O maior valor possível de Xé 2, de forma que P(X ^ 2) = 
1 e, se x for um número maior que 2, P(X ^ x) = 1 ; isto é, P(X S5)= 1 , P(X s 10,23) = 1 e assim por dian- 
te. Observe que P(X < 1 ) = 0,5 ^ P(X ^ 1 ), pois a probabilidade de X com valor 1 está incluída na última pro- 
babilidade, mas não na anterior. Quando X é uma variável aleatória discreta e x é um valor possível de X, P(X < r) < 
P{X < x). 


DEFINIÇÃO 


A função de distribuição acumulada (FDA) F(x) de uma variável aleatória discreta X 
com fmp p(x) é definida para cada valor de x por 

F(jc) = P(X<jc)= I p(y) 

y: ys x 

Para qualquer valor jt, F(x) é a probabilidade de o valor X observado ser no máximo x. 


Exemplo 3.11 

A fmp de Y (quantidade de classificações sangüíneas) no Exemplo 3.9 foi 


y 

1 2 

3 

4 

p(y) 

0,4 0,3 

0,2 

0,1 


Primeiro determinamos F(y) para cada valor do 

conjunto 

{ 1 , 2, 3, 4 ) de valores possíveis: 

F(l) = P(Y< 

D 

= P(Y = 

1) = P(D 

= 0,4 

F(2) = P{Y< 

2) 

= P(Y = 

1 ou 2) = 

/Kl) + p( 2) = 0.7 

F( 3) = F(F< 

3) 

= P(Y = 

1 ou 2 ou 

3)=F(l)+F(2)+p(3) = 0,9 

F(4) = P(Y< 

4) 

= P(Y = 

1 ou 2 ou 

3 ou 4) = 1 


Assim sendo, para qualquer outro valor de y, F(y ) será igual ao valor de F mais próximo possível de Y à es- 
querda de y . Por exemplo: F( 2,7) = P(Y < 2,7) = P(F < 2) = 0,7, e F{ 3,999) = F( 3) = 0,9. A FDA é, portanto 


F(y) = 


0 se y < 1 


0,4 

se 1 £ >> < 

0,7 

se 2 £ y < 

0,9 

se 3 s y < 

1 

se 4 


O gráfico de F(y) é mostrado na Figura 3.5. 


F{y) 

1 


12 3 4 

Figura 3.5 O gráfico da FDA do Exemplo 3.11 


Para uma va discreta X, o gráfico de F(x) terá um salto em cada valor possível de X e será uma reta entre 
os valores possíveis. Esse gráfico é denominado função degrau. 
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Exemplo 3.12 

No Exemplo 3.10, qualquer inteiro positivo tinha um valor X possível e a fmp era 


P(x) = { 


(1 - pY 'p x= 1,2, 3, ... 
0 caso contrário 


Para qualquer inteiro positivo x. 


x— 1 


F(x) = x p(y) = X 0 - p> v_l p = p Z (i - p>' 

y^x y~ 1 y — 0 

Para calcular essa soma, usamos o fato de que a soma parcial de uma série geométrica é 

1 - a k+ ' 


2> = , „ 

y-0 1 — O 

Usando essa expressão na Equação (3.4), com a = 1 — p e k = x — 1, temos 

F(x) = p • — = 1 — ( 1 — p) x sendo x um inteiro positivo 

F l-(l-p) 

Como F é constante entre inteiros positivos, 


(3.4) 


F(x) = 


0 

1 - (1 - p) M 


x< 1 
x > 1 


(3.5) 


onde [jc] é o maior inteiro s x (por exemplo, [2,7] = 2). Portanto, se p = 0,51, como no exemplo dos nascimen- 
tos, a probabilidade de se ter de examinar no máximo cinco nascimentos para se ver o primeiro menino é de F( 5) = 
1 - (0,49) 5 = 1 - 0,0282 = 0,9718, enquanto F(10) = 1,0000. Essa FDA está representada na Figura 3.6. 


F(x) 


1 - 


o 



— L_ 

51 


x 


Figura 3.6 


Gráfico de FM do Exemplo 3.12 


Nos exemplos até agora, a FDA origina-se da fmp. Tal processo pode ser revertido para se obter a fmp da 
FDA sempre que esta última função estiver disponível. Suponha, por exemplo, que X represente o número de 
componentes com defeito em um lote de seis componentes, de forma que os valores possíveis de X são 0, 1, .... 
6. Então 


Pi 3) = P(X = 3) 

= [piO) +p(l)+pi2)+ p(3)] - 0(0) + pi 1) + piD] 

= P(X < 3) - P{X < 2) 

= Fi 3) - Fi2) 

De forma mais geral, a probabilidade de X estar em um intervalo especificado é obtida facilmente a partir 
da FDA. Por exemplo: 

P(2 < X < 4) = pi 2) + pi 3) + pi 4) 

= 0(0) + • • • + p(4)] - 0(0) + p(l)] 

= P(X < 4) - P(X < 1) 

= F(4)-F(1) 
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Observe que F( 2 £ X < 4) ^ F( 4) — F( 2). O fato ocorre porque o valor 2 de X está incluído em 2 s X < 
4, de forma que não queremos desprezar essa probabilidade. Entretanto, P( 2 < X ^ 4) = F(4) - F( 2) porque 
X = 2 não está incluído no intervalo 2 < X ^ 4. 


PROPOSIÇÃO 


Para quaisquer dois números ac b com a ^ b, 

P(a < X < 6) = F(b) - F(a-) 

onde “a-” representa o maior valor possível de X estritamente menor que a. Em particu- 
lar, se os únicos valores possíveis forem inteiros e, se a e b forem inteiros, então 

P(a < X < 6) = P(X = a ou a + 1 ou ... ou b) 

= F(b) - F(a - 1) 

Considerando a = b resulta que P(X = a) = F(a) - F(a — 1), nesse caso. 


0 motivo de subtrair F(a-) em vez de F(a) é que queremos incluir P(X = a); F(b) - F(a) fornece P(a < 
X s b). Essa proposição será usada extensivamente no cálculo da probabilidade binomial e de Poisson nas 
Seções 3.4 e 3.6. 

Exemplo 3.13 

Seja X = o número de dias de licença por doença de um funcionário de uma grande empresa, selecionado aleato- 
riamente em certo ano. Se o número máximo de dias permitidos por ano for 14, os valores possíveis de X são 0, 
1 14. Com F(0) = 0,58, F(l) = 0,72, F(2) = 0,76, F( 3) = 0,81, F(4) = 0,88, e F( 5) = 0,94, 

P(2 < X < 5) = P(X = 2, 3, 4, ou 5) = F(5) — F( 1 ) = 0,22 

e 

P(X = 3) = F( 3) - F( 2) = 0,05 ■ 


Outra visão das funções de massa de probabilidade 

Frequentemente é útil imaginar a fmp como especificação de um modelo matemático para população discreta. 

Exemplo 3.14 

Considere a escolha aleatória de um estudante entre os 15.000 matriculados no semestre corrente na Mega Uni- 
versity. Seja X = número de cursos em que o estudante selecionado está matriculado e suponha que X tenha a 
fmp mostrada a seguir. 


X 

1 2 

3 

4 

5 

6 

7 

p(x) 

0,01 0,03 

0,13 

0,25 

0,39 

0,17 

0,02 


Uma forma de interpretar tal situação é imaginar a população formada por 15.000 indivíduos, cada um com 
seu próprio valor X. A proporção de cada valor X é dada por p(x). Um ponto de vista alternativo é esquecer dos 
alunos e pensar na população em si como formada pelos valores X: há alguns ls na população, 2s e alguns 7s. 
A população então consiste dos números 1, 2, ..., 7 (portanto, é discreta) e p(x) fornece um modelo da dis- 
tribuição dos valores da população. ■ 


Uma vez definido o modelo da população, podemos usá-lo para calcular os valores das características da 
população (por exemplo, a média p.) e fazer inferências sobre tais características. 
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Exercícios | Seção 3.2 (11-27) 


11 . Uma instalação de recondicionamento de automóveis 
especializada em regulagem de motores sabe que 45% 
de todas as regulagens são feitas em automóveis de 
quatro cilindros, 40% em automóveis de seis cilin- 
dros e 15% em automóveis de oito cilindros. Seja 
X = número de cilindros do próximo carro a ser 
preparado. 

a. Qual é a fmp de X? 

b. Desenhe um gráfico de linhas e um histograma de 
probabilidade da fmp da parte (a). 

c. Qual é a probabilidade de o próximo carro a ser 
regulado ter no mínimo seis cilindros? Mais de 
seis cilindros ? 

. As empresas aéreas algumas vezes fazem overbook de 
voos. Suponha que. para um avião de 50 lugares, te- 
nham sido vendidas 55 passagens. Defina a variável 
aleatória Y como o número de passageiros com pas- 
sagens que compareceram ao voo. A função massa de 
probabilidade de Y é exibida na tabela a seguir. 


y 

45 46 47 48 49 50 51 52 53 54 55 

p( V) 

0.050,100,120,14 0,25 0,17 0,06 0,05 0,03 0,02 0,01 


a. Qual é a probabilidade de que o vôo acomode todos 
os passageiros que comparecerem? 

b. Qual é a probabilidade de nem todos os passageiros 
que comparecerem serem acomodados? 

c. Se você for a primeira pessoa da lista de espera (o que 
significa que será o primeiro a subir no avião, se hou- 
ver assentos disponíveis após todos os passageiros 
terem sido acomodados), qual será a probabilidade de 
estar no vôo? Qual é a probabilidade, se você for a 
terceira pessoa da lista de espera? 

13. Uma empresa que fornece computadores pelo correio 
tem seis linhas telefônicas. Seja X o número de linhas 
em uso em determinado horário. Suponha que a fmp de 
X seja conforme a tabela a seguir. 


X 

0 1 

2 

3 

4 

5 

6 

p{x ) 

0,10 0,15 

0,20 

0,25 

0,20 

0,06 

0,04 


Calcule a probabilidade de cada um dos seguintes 
eventos. 

a. {no máximo três linhas estão em uso} 

b. {menos de três linhas estão em uso} 

c. {pelo menos três linhas estão em uso} 

d. {entre duas e cinco linhas, inclusive, estão 
em uso} 

e. {entre duas e quatro linhas, inclusive, não estão 
em uso} 

f. {pelo menos quatro linhas não estão em uso} 

14 . Um empreiteiro é solicitado pelo departamento de 
planejamento de uma cidade a enviar um, dois, três. 


quatro ou cinco formulários (dependendo da natureza 
do projeto) quando requer um alvará de construção. 
Seja Y = o número de formulários requeridos do pró- 
ximo empreiteiro. Sabe-se que a probabilidade de v for- 
mulários serem exigidos é proporcional a y , isto é, p(y ) 
= Ârv para y— 1,...,5. 

a. Qual é o valor de kl [ Sugestão : Zv=i p(y) = 1.] 

b. Qual é a probabilidade de no máximo três for- 
mulários serem exigidos? 

c. Qual é a probabilidade de serem requeridos entre 
dois e quatro formulários (inclusive)? 

d. Poderia p(y) = //50 para y = 1 5 ser a fmp de Y1 

15 . Muitos fabricantes possuem programas de controle de 
qualidade que incluem a inspeção de defeitos no rece- 
bimento dos materiais. Suponha que um fabricante de 
computadores receba placas em lotes de cinco. Duas 
placas em cada lote são selecionadas para inspeção. 
Podemos representar os resultados possíveis do proces- 
so pela seleção de pares. Por exemplo: o par (1, 2) re- 
presenta a seleção das placas 1 e 2 para inspeção. 

a. Relacione os 10 resultados diferentes possíveis. 

b. Suponha que as placas 1 e 2 sejam as únicas com de- 
feito em um lote de cinco. Duas placas serão es- 
colhidas aleatoriamente. Defina X como o número 
observado de placas com defeito entre as inspecio- 
nadas. Determine a distribuição de probabilidades 
de X. 

c. Seja F(x ) a FDA de X. Primeiro determine F(0) = 
P(X < 0), F(l), e F( 2), e depois obtenha F(x) para 
todos os outros jc. 

16 . Algumas partes da Califórnia são particularmente 
propensas a terremotos. Suponha que em tal área, 30% 
de todos os moradores tenham seguro contra danos por 
terremotos. Quatro moradores são selecionados aleato- 
riamente. Seja X o número dos que possuem seguro 
contra danos por terremotos, entre os quatro. 

a. Determine a distribuição de probabilidades de X. 
[Sugestão: seja S o morador que tem seguro c N o 
que não o tem. Uma possibilidade será SNSS , com 
probabilidade (0,3)(0,7)(0,3)(0,3) e valor associado 
X = 3. Há outros 15 resultados]. 

b. Desenhe o histograma de probabilidade corres- 
pondente. 

c. Qual é o valor mais provável de X? 

d. Qual é a probabilidade de que ao menos dois dos 
quatro moradores selecionados tenham seguro? 

17» A voltagem de uma pilha nova pode ser aceitável (A) 

\J ou inaceitável (/). Uma lanterna específica exige duas 
pilhas, que serão selecionadas e testadas independen- 
temente até que sejam encontradas duas aceitáveis. 
Suponha que 90% de todas as pilhas tenham vol- 
tagem aceitável. Seja Y o número de pilhas que de- 
vem ser testadas. 
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a. Qual é o valor de p( 2), isto é, P(Y = 2)? 

b. Qual é o valor de p( 3)? ( Sugestão : Há dois resulta- 
dos diferentes que dão Y = 3.) 

c. Para ter Y = 5, o que deve ser verdadeiro para a quinta 
pilha selecionada? Relacione os quatro resultados 
possíveis para os quais Y = 5 e depois determine p( 5). 

d. Use o padrão de suas respostas para as partes (aHc) 
para obter a fórmula geral de p(y). 

Dois dados de seis lados são lançados independente- 
mente. Seja M = o máximo dos dois lançamentos (en- 
tão Xf( 1,5) = 5, Af(3, 3) = 3 etc.). 

a. Qual é a fmp de Aft [ Sugestão : Determine primeiro 
p(l), depois p{2) e assim por diante]. 

b. Determine a FDA de M e desenhe o gráfico. 


19. No Exemplo 3.9, suponha que haja apenas quatro 
doadores potenciais de sangue dos quais apenas um tem 
sangue tipo 0+ . Calcule a fmp de Y. 

20. Uma biblioteca assina duas revistas semanais diferentes, 
que supostamente chegam na correspondência de quarta- 
feira. Na verdade, elas podem chegar na quarta, quinta, 
sexta ou sábado. Suponha que as duas cheguem inde- 
pendentemente uma da outra e para cada uma P( qua.) = 
0,3, P( qui.) = 0,4, P( sex.) = 0,2 e P( sáb.) = 0,1. Seja 
Y = número de dias, após a quarta-feira, que as revistas 
levam para chegar (os valores possíveis de Y são 0, 1,2 
ou 3). Calcule a fmp de Y. [ Sugestão : Há 16 resultados 
possíveis; Y(qua., qua.) = 0 , Y(qua ., qui.) = 2 e assim 
por diante]. 

21. Refira-se ao Exercício 13, calcule e desenhe o gráfico 
da FDA F(x). Utilize-a para calcular a probabilidade 
dos eventos descritos nas partes (a)-(d) do problema. 

22. Uma organização de consumidores que avalia au- 
tomóveis novos relata costumeiramente o número de de- 
feitos graves em cada carro examinado. Seja X o número 
de defeitos graves em um carro de determinado tipo se- 
lecionado aleatoriamente. A FDA de X é como abaixo: 


F(x) = 


0 

X 

< 

0 



0.06 

0 

< 

X 

< 

1 

0,19 

1 

< 

X 

< 

2 

0.39 

2 

< 

X 

< 

3 

0,67 

3 

< 

X 

< 

4 

0,92 

4 

< 

X 

< 

5 

0,97 

5 

< 

X 

< 

6 

1 

6 

< 

X 









Calcule as seguintes probabilidades diretamente pe- 
la FDA: 

a. p( 2), isto é, P(X = 2) 

b. P(X > 3) 

c. P(2 < X < 5) 

d. P{2 < X < 5) 

Uma empresa de seguros oferece aos seus segurados 
diferentes opções de pagamento premi um. Para um se- 
gurado selecionado aleatoriamente, seja X = número 


de meses entre pagamentos sucessivos. A FDA de X é 
como segue: 


0 

x < 1 

0,30 

1 <*< 3 

0,40 

3 <jc<4 

0.45 

4 < Jt < 6 

0,60 

6<*< 12 

1 

12 < jc 


a. Qual é a fmp de XI 

b. Usando apenas a FDA, calcule PO ^ X < 6) e 
P ( 4 < X). 

24. No Exemplo 3.10, seja Y = o número de meninas nasci- 
das antes do final do experimento. Com p = P(B) e 
1 - p = P(G), qual é a fmp de K? ( Sugestão : Primeiro 
relacione os valores possíveis de F, começando pelo 
menor, e continue até obter uma fórmula geral). 

25. Alvie Singer vive no ponto 0 do diagrama abaixo e tem 
quatro amigos que vivem em A, B, C e D. Um dia, Alvie 
decide visitá-los e lança uma moeda duas vezes para de- 
cidir quais dos quatros visitará. Depois de chegar na 
casa de um amigo, ele pode retomar para casa ou con- 
tinuar a visita a uma das duas casas adjacentes (como 0, 
A ou C quando em B ), tendo cada uma das três possibi- 
lidades com probabilidade}. Dessa forma, ele continua 
a visitar amigos até voltar para casa. 



a. Seja X = o número de vezes que Alvie visita um 
amigo. Determine a fmp em relação a X . 

b. Seja Y = o número de segmentos de reta que Alvie 
percorre (incluindo os que chegam e saem de 0). 
Qual é a fmp de Y1 

c. Suponha que amigas vivam em A e C e amigos em B 
e D. Se Z = o número de visitas a amigas, qual é a 
fmp de Z? 

26. Depois que todos os estudantes saírem da sala de aula, 
um professor de estatística observa que quatro cópias do 
livro foram deixadas sob as mesas. No começo da pró- 
xima aula, o professor distribui os quatro livros de forma 
completamente aleatória para cada um de quatro alunos 
(1, 2, 3 e 4) que dizem ter esquecido os livros. Um re- 
sultado possível é que 1 receba o livro de 2, 2 receba o 
livro de 4, 3 receba o seu livro e 4 receba o livro de 1. 
Esse resultado pode ser abreviado como (2, 4, 3, 1). 

a. Relacione os outros 23 resultados possíveis. 

b. Seja X o número de estudantes que recebem o 
próprio livro. Determine a fmp de X. 

27. Demonstre que a FDA F( x) é uma função não-decres- 
cente; isto é, jc, < x 2 implica F( jc,) ^ F(x 2 ). Em que 
condições F(x t ) = F( x 2 )? 
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3.3 


Valores Esperados de Variáveis 
Aleatórias Discretas 


No Exemplo 3.14, consideramos uma universidade com 15.000 alunos e consideramos X = o número de cursos 
em que um aluno selecionado aleatoriamente estava matriculado. A fmp de Xé mostrada a seguir. Como p(l) = 
0,01, sabemos que (0,01) • (15.000) = 150 alunos estão matriculados em um curso e assim sucessivamente para 
os outros x valores. 


X 

1 

2 

3 

4 

5 

6 

7 

p(x) 

0,01 

0,03 

0,13 

0,25 

0,39 

0,17 

0,02 

Número de alunos matriculados 

150 

450 

1950 

3750 

5850 

2550 

300 


Para calcular o número médio de cursos por aluno ou o valor médio de X na população, devemos calcular 
o número total de cursos e dividir pelo número total de alunos. Como cada um dos 150 alunos está matriculado 
em um curso, esses 150 contribuem com 150 cursos no total. De forma similar, 450 alunos contribuem com 
2(450) cursos e assim por diante. O valor médio da população X é 

1(150) + 2(450) + 3(1950) + • • • + 7(300) . 

15.000 

Como 150/15.000 = 0,01 = p( 1), 450/15.000 = 0,03 = p( 2), e assim por diante, uma expressão alterna- 
tiva para (3,7) é 

1 * P(l) + 2 • p(2) + • • • + 7 • pÇJ) (3.8) 

A Expressão (3.8) mostra que, para calcular o valor médio da população de X, precisamos apenas dos va- 
lores possíveis de X juntamente com suas probabilidades (proporções). Em particular, o tamanho da população 
é irrelevante, desde que a fmp seja dada por (3,6). A média ou valor médio de X é, portanto, uma média pon- 
derada dos valores possíveis 1, ... , 7, em que os pesos são as probabilidades dos valores. 


Valor esperado de X 


DEFINIÇÃO 


Seja X como uma va discreta com conjunto de valores possíveis D e fmp p(x). O valor 
esperado ou valor médio de X, denotado por E(X) ou p x , é 

E{X) = p x = X * ’ PQO 

x£D 


Quando está claro a que X o valor esperado se refere, p é usado no lugar de p x . 

Exemplo 3.15 
Para a fmp em (3.6), 

p= l-p(l) + 2-p(2) + --- + 7-p(7) 

= (1)(0,01) + 2(0,03) + • • • + (7)(0,02) 

= 0,01 + 0,06 + 0,39 + 1,00 + 1,95 + 1,02 -I- 0,14 = 4,57 

Se imaginarmos que a população consiste dos X valores 1, 2, ... , 7, então p = 4,57 é a média da popu- 
lação. Na seqüência, freqiien temente nos referiremos a p como a média da população em vez de média de X 
na população. ■ 
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No Exemplo 3.15, o valor esperado de p era 4,57, que não é um valor possível de X. A palavra esperado 
deve ser interpretada com cautela porque uma pessoa não espera ver um valor de X = 4,57 quando um único es- 
tudante é selecionado. 

Exemplo 3.16 

Após cada nascimento, os bebês são classificados de acordo com uma escala denominada Apgar. As classi- 
ficações possíveis são 0, 1,..., 10, com a classificação do bebê determinada por cor, tônus muscular, esforço res- 
piratório, batimentos cardíacos e irritabilidade reflexas (a melhor pontuação possível é 10). Seja X o escore 
Apgar de uma criança selecionada aleatoriamente em um determinado hospital no próximo ano e suponha que 
a fmp de X seja 


X 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

p(x) 

0,002 

0,001 

0,002 

0,005 

0,02 

0,04 

0,18 

0,37 

0,25 

0,12 

0,01 


O valor médio de X será 


E(X) = p = 0(0,002) + 1(0,001) + 2(0,002) 

+ • • •+ 8(0,25) + 9(0,12) + 10(0,01) 

= 7,15 

Novamente, p não é um valor possível da variável X. Além disso, como a variável se refere a uma futura 
criança, não há uma população existente, concreta, a que se refira. Em vez disso, imaginamos a fmp como um 
modelo para uma população conceituai consistindo dos valores 0, 1, 2 ,..., 10. O valor médio dessa população 
conceituai é p, = 7,15. ■ 


Exemplo 3.17 


Seja X = 1 se um componente selecionado aleatoriamente precisar de reparo em garantia e = 0 caso contrário. 
Então X será uma va Bemoulli com fmp 


1 — p x = 0 


PM = 


P 

0 


x = 1 
x # 0, 1 


pela qual E(X) = 0 • p( 0) + 1 • p(l) = 0(1 — p) + \(p) = p. Isto é, o valor esperado de X é apenas a probabi- 
lidade de X ser igual ao valor 1 . Se conceitualizarmos uma população formada por zeros na proporção 1 — p e 
de ls na proporção p, então a média da população é p = p. ■ 


Exemplo 3.18 

A forma geral da fmp de X = número de crianças nascidas até o nascimento do primeiro menino (inclusive) é 


P(x) = 


p(l - pY 1 x = 1, 2, 3, . 
0 caso contrário 


Pela definição. 


E(X) = • p(x) = £ xp(l - pY 1 = p X [- (1 - pf] 

d jT-i x=\\_ ap J 


(3.9) 


Se trocarmos a ordem de cálculo da derivada e da soma, a soma será a de uma série geométrica. Depois 
de calcular a soma, calcula-se a derivada e o resultado final é E(X) =l/p. Se p estiver próximo de 1, espera-se 
ver um menino em breve, enquanto, se p estiver próximo de 0, esperam-se muitos nascimentos antes do primeiro 
menino. Para p = 0,5, E(X) = 2. ■ 
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Há outra interpretação de pt usada freqüentemente. Considere a fmp 


p(x) = 


(0,5) • (0,5)'- ' 
0 


se x = 1 , 2, 3, . . . 
caso contrário 


Essa é a fmp de X = número de lançamentos necessários de uma moeda para obter a primeira “cara” (um 
caso especial do Exemplo 3.18). Suponha que observemos um valor x dessa fmp (lançar uma moeda até apare- 
cer uma “cara”), e então observemos outro valor independentemente (continue lançando), e depois outro e as- 
sim sucessivamente. Se depois de observarmos um grande número de valores x calcularmos a média deles, a mé- 
dia amostrai resultante será muito próxima de p. = 2. Isto é, fx pode ser interpretado como o valor observado da 
média de longo prazo de X quando o experimento é executado repetidamente. 

Exemplo 3.19 

Seja X o número de entrevistas pelas quais um estudante passa antes de conseguir um emprego, com fmp 

( kJx 2 x = 1 , 2, 3, . . . 

| 0 caso contrário 

onde k é escolhido de forma que 2 ”=i (k/x 2 ) = 1 . (Nos cursos de matemática sobre séries infinitas, é demonstrado 
que 2 t=i (l/x 2 ) < oo, que implica que k existe, mas seu valor exato não nos preocupa). O valor esperado de X é 

= £(X) = £ x • 4 = k l ~ (3.10) 

Jt=l x- x=\ x 

A soma à direita da Equação (3. 10) é a famosa série harmônica da matemática e pode ser demonstrado que 
é igual a oo. E(X) não é finito, neste caso, porque p(x) não decresce tão rapidamente quanto x aumenta. Os es- 
tatísticos dizem que a distribuição de probabilidade de X possui “uma cauda longa”. Se for escolhida uma se- 
qüência de valores de X usando essa distribuição, a média amostrai não terá um valor finito, mas tenderá a crescer 
sem limite. 

Os estatísticos usam a expressão “caudas longas” em relação a quaisquer distribuições que tenham valor de 
probabilidade grande distante de /x, (portanto caudas longas não requerem /x = <*). Caudas longas dificultam as 
inferências sobre p.. ■ 


Valor esperado de uma função 

Freqüentemente estamos interessados no valor esperado de alguma função h(X) em vez de X em si mesmo. 
Exemplo 3.20 

Suponha que uma livraria compre 10 cópias de um livro a US$ 6,00 cada para vendê-las a US$ 12,00, sabendo 
que ao fim de um período de 3 meses os livros não vendidos podem ser devolvidos por US$ 2,00. Se X = ao 
número de cópias vendidas, então a receita líquida será = h(X) — 12X + 2(10 — X) — 60 = 10X — 40. ■ 

Uma forma fácil de calcular o valor esperado de h(X) é sugerida pelo exemplo a seguir. 

Exemplo 3.21 

Seja X = o número de cilindros do motor do próximo carro a ser regulado em certa oficina. O custo de uma re- 
gulagem é relacionado a X por h(X) = 20 + 3X + 0,5X 2 . Como X é uma variável aleatória, h(X) também o é. 
Denote essa última va por Y. As fmps de X e Y são: 


X 

4 

6 

8 

y 

40 

56 

76 

p(x) 

0,5 

0,3 

0,2 

p(y ) 

0,5 

0,3 

0,2 
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Denotando os valores possíveis de Y por D*, temos 

E(Y) = E[h(X)] =Xyp(y) (3.11) 

D * 

= (40X0,5) + (56X0,3) + (76)(0,2) 

= h( 4) • (0,5) + h(6) • (0,3) + /i(8) • (0,2) 

= £ h( x) • p(x) 

D 

De acordo com a Equação (3.1 1), não é necessário determinar a fmp de Y para obter E(Y). O valor espe- 
rado é a média ponderada dos valores possíveis de h(x) (em vez de x). ■ 


PROPOSIÇÃO 


Se a va X tiver um conjunto de valores possíveis D e fmp p(x), o valor esperado de qual- 
quer função h(X), expresso por E[h(X)] ou /a WX) , é calculado por 

E[h(X)] = X h(x) • plx) 

D 


De acordo com a proposição, £[/XX)] é calculada da mesma forma que E(X) em si, exceto que h{x) é usa- 
do no lugar de x. 

Exemplo 3.22 

Uma loja de computadores comprou três computadores de certo tipo a US$ 500 cada. Eles serão vendidos a US$ 
1 .000 cada. O fabricante concordou em aceitar a devolução dos computadores não vendidos, após um período 
especificado, por US$ 200 cada. Seja X o número de computadores vendidos e suponha que p(0) = 0, 1 , p( 1 ) = 
0,2, p( 2) = 0,3, e p( 3) = 0,4. Definindo como h(X) o lucro associado à venda de X unidades, as informações 
fornecidas implicam que h(X) = receita - custo = 1000X + 200(3 — X) - 1500 = 800X - 900. O lucro espe- 
rado será então 


E[h(X)] = h(0) • p( 0) + h( 1) • p(l) + h{ 2) • p( 2) + h( 3) • p( 3) 

= (-900X0,1) + (-100)(0,2) + (700X0,3) + (1500)(0,4) 

= $700 ■ 

Regras do valor Esperado 

A função h(X) freqüentemente é uma função linear aX + b. Nesse caso, E[h(X)] é facilmente calculado 
pela E{X). 


PROPOSIÇÃO 


E(aX + b) = a- E(X) + b 

(Ou, usando notação alternativa, p. aX+ b = a • p. x + b.) 


Em palavras, o valor esperado de uma função linear é igual à função linear calculada com o valor esperado 
E(X). Como h(X) no Exemplo 3.22 é linear e E(X) = 2, £[/t(X)] = 800(2) — 900 = US$ 700, como antes. 

Demonstração 

E(aX + b) = Y{ax + b) • p(x) = a^x • p(x) + b^p{x) 

D DD 

= aE(X) + b m 

Dois casos especiais da proposição fornecem duas regras importantes do valor esperado. 
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1. Para qualquer constante a, E(aX) = a • E{X) (assumir b = 0). (3. 1 2) 

2. Para qualquer constante b, E(X + b) = E(X) + b (assumir a = 1 ). 


A multiplicação de X por uma constante a altera a unidade de medida (de dólares para centavos, onde a = 
100, de polegadas para centímetros, onde a = 2,54 etc.). A regra 1 diz que o valor esperado nas novas unidades 
é igual ao valor das antigas, multiplicado pelo fator de conversão a. De forma similar, se uma constante b for 
adicionada a cada valor possível de X, então o valor esperado será deslocado do valor da constante. 

Variância de X 

O valor esperado de X descreve onde a distribuição de probabilidades está centrada. Usando a analogia física de 
colocação de pontos de massa p(x) no valor x de um eixo unidimensional, se o eixo estiver apoiado em um ful- 
cro posicionado em p, não há tendência de inclinação do eixo. O fato é ilustrado para duas distribuições dife- 
rentes na Figura 3.7. 


pix) 


íXx) 



0.5 

- 

0,5 





t 


• 


j . 1 

I 


T , , ^ ^ , L 


' 2 3 i 

5 

1 2 3 ^ 5 6 7 8 


(a) (b) 

Figura 3.7 Duas distribuições de probabilidade diferentes com n = 4 


Apesar de ambas as distribuições ilustradas na Figura 3.7 terem o mesmo centro p, a distribuição da Figura 
3.7(b) tem maior dispersão ou variabilidade do que a da Figura 3.7(a). Usaremos a variância de X para avaliar o 
valor da variabilidade de (a distribuição de) X , do mesmo modo que s 2 foi usado no Capítulo 1 para medir a 
variabilidade de uma amostra. 


DEFINIÇÃO 


Seja X com fmp p(x) e o valor esperado p. A variância de X , denotada por V(X) ou o - *, ou 
apenas cr 2 , é 

V(X) = I (* - p) 2 • p(x) = E[(X - p) 2 ] 

o 


O desvio padrão (DP) de X é 

a x = Vãl 


A quantidade h(X) = (X - p) 2 é o quadrado do desvio de X em relação à sua média e a 2 é o quadrado do 
desvio esperado. Se a maior parte da distribuição de probabilidade estiver próxima de p, cr 2 será relativamente 
pequena. Entretanto, se houver valores de x distantes de p com p(x) grande, cr 2 será bem grande. 

Exemplo 3.23 

Se X é o número de cilindros do próximo carro a ser regulado em uma oficina, com a fmp do Exemplo 3.21 
\p( 4) = 0.5, p( 6) = 0,3, p( 8) = 0,2, de onde p = 5.4], então 

V(X) = cr 2 = Í(x- 5A) 2 'P(x) 

x=4 

= (4 - 5,4) 2 (0,5) + (6 - 5,4) 2 (0,3) + (8 - 5,4) 2 (0,2) = 2,44 
O desvio padrão de X é cr = V2,44 = 1 ,562. ■ 
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Quando a fmp p(x) especifica um modelo matemático para a distribuição dos valores da população, a 1 ta 
medem a dispersão dos valores da população: a 1 é a variância da população taê o desvio padrão da população. 

Fórmula Alternativa de a 2 

A quantidade de operações aritméticas necessárias para calcular <r : pode ser reduzida usando-se uma fórmula 
alternativa de cálculo. 


PROPOSIÇÃO 


V(X) = (T 2 = 

2-r ' p{x) 

-p 2 = E(X 2 ) - [£(X)] 2 


_D 



Ao usar essa fórmula, E(X 2 ) é calculado primeiro sem necessidade de subtração e então E(X) é calculado, 
elevado ao quadrado e subtraído (uma vez) de E(X 2 ). 

Exemplo 3.24 

A fmp do número de cilindros X do próximo carro a ser regulado em uma oficina foi fornecida no Exemplo 3.23 
como p( 4) = 0,5, p( 6) = 0,3, e p( 8) = 0,2, de onde p = 5,4 e 

E(X 2 ) = (4 2 )(0,5) + (6 2 )(0,3) + (8 2 )(0,2) = 31,6 

Portanto cr 2 = 31,6 - (5,4) 2 = 2,44, conforme o Exemplo 3.23. ■ 


Demonstração da Fórmula Alternativa 

Desenvolva ( x - p) 2 da definição de cr : para obter x 2 - 2px + p 2 , e depois calcule a somatória (£) de cada um 
dos três termos: 


cr 2 = J^x 2 • p(x) - 2 p • * P(x) + p 2 "Zp(x) 

D DD 

= E(X 2 ) - 2p • p + p 2 = E(X 2 ) - p 2 m 


Regras da Variância 

A variância de h(X) é o valor esperado do quadrado da diferença entre h(X) e seu valor esperado: 

V[h(X)] = <r 2 h{X) = 2 ih(x) - E[h(X)]} 2 • p(x) (3. 1 3) 

D 

Quando h(X) for uma função linear, V[/i(X)] é facilmente relacionada a V(A). 


PROPOSIÇÃO 


V(aX + b) = (Tax+h = a 2 -a 2 x e o- aX+b = | a | • <r x 


Esse resultado nos diz que a adição da constante b não afeta a variância, o que é intuitivo, porque a adição 
de b muda a localização (valor da média) mas não a dispersão dos valores. Em particular. 


1. alx = a 2 • oi, a aX = | o | • <T X 

2. o*-*-* = o* 


(3.14) 


O motivo do valor absoluto na expressão de cr,,* é que a pode ser negativo, ao passo que o desvio padrão 
não pode. a 2 resulta quando a é eliminado do termo que se eleva ao quadrado na Equação (3.13). 
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Exemplo 3.25 

No problema da venda de computador do Exemplo 3.22, E(X) = 2 e 

E(X 2 ) = (0) ! (0,l) 4- ( 1 ) 2 (0,2) + (2) 2 (0,3) + (3) 2 (0,4) = 5 

então V(X) = 5 — (2) 2 = 1. A função lucro h(X) = 80QY — 900 tem variância (800) 2 • V(X) = (640.000)(1) = 
640.000 e desvio padrão 800. ■ 


Exercícios 

28 


Seção 3.3 (28-43) 


V 


A fmp de X = o número de defeitos graves em um 
eletrodoméstico selecionado aleatoriamente é 


X 

0 

1 

2 

3 

4 

p(x) 

0,08 

0,15 

0,45 

0,27 

0,05 


Calcule os dados a seguir: 

a. E(X) 

b. V(X) diretamente pela definição 

c. O desvio padrão de X 

d. V(X) usando a fórmula alternativa. 

Í9) Um indivíduo que possui um seguro de automóvel de 
uma determinada empresa é selecionado aleato- 
riamente. Seja Y o número de infrações ao código de 
trânsito para as quais o indivíduo foi reincidente nos úl- 
timos 3 anos. A fmp de Y é 


y 

0 

1 

2 

3 

P(y) 

0,60 

0,25 

0,10 

0,05 


a. Calcule E(Y). 

b. Suponha que um indivíduo com Y infrações reinci- 
dentes incorra em uma multa de US$ 100J' 2 . Calcule 
o valor esperado da multa. 


30. Refira-se ao Exercício 12 e calcule V(Y) e cr Y . Deter- 
mine, então, a probabilidade de Y estar dentro do inter- 
valo de 1 desvio padrão em tomo da média. 



Uma loja de eletrodomésticos vende três modelos dife- 
rentes d efreezers verticais com 13,5, 15,9 e 19,1 pés cú- 
bicos de espaço, respectivamente. Seja X = volume de 
armazenagem comprado pelo próximo cliente a comprar 
um freezer. Suponha que a fmp de X seja 


X 

13,5 

15,9 

19,1 

p ( X) 

0,2 

0,5 

0,3 


a. Calcule E(X), E(X 2 ) e V(X). 

b. Se o preço de um freezer com X pés cúbicos de ca- 
pacidade for 25X - 8,5, qual será o preço esperado 
pago pelo próximo cliente a comprar um freezer ? 

c. Qual é a variância do preço 25X - 8,5 pago pelo 
próximo cliente? 

d. Suponha que, apesar de a capacidade nominal de 
um freezer ser X, a capacidade real seja h(X) = 
X - 0,01X 2 . Qual é a capacidade real esperada do 
freezer comprado pelo próximo cliente? 


32. Se. 


ija X uma va de Bemoulli com fmp como no Exem- 
plo 3.17. 

a. Calcule £(X 2 ). 

b. Demonstre que V(X) = p( 1 — p). 

c. Calcule £(X 79 ). 


33. Suponha que o número de certo tipo de planta encon- 
trada em uma região retangular (denominada quadrai 
pelos ecologistas) em uma determinada área geográfica 
seja uma va X com fmp 


_ rc/jc* x = 1,2,3,... 

p(x) - | o caso contrário 



£(X) é finito? Justifique sua resposta (essa é ou- 
tra distribuição que os estatísticos denominam 
“cauda longa”). 

Uma pequena drogaria solicita cópias de uma revista 
para seu display todas as semanas. Represente por X = 
demanda da revista, com fmp 


X 

1 2 3 4 5 6 

p(x) 

1 2 3 4 3 2 

13 15 15 15 IS 15 


Suponha que o proprietário da loja pague US$ 1 ,00 por 
cópia e o preço de venda seja US$ 2,00. Se as revistas 
não vendidas até o fim da semana não têm valor, é 
melhor comprar três ou quatro cópias? ( Sugestão : 
Expresse a receita líquida em função da demanda X 
de três e quatro cópias da revista e depois calcule a re- 
ceita esperada). 


35. Seja X o dano (em valor monetário) incorrido por um 
determinado tipo de acidente em um ano. Os valores 
possíveis de X são 0, 1000, 5000 e 10000, com proba- 
bilidades 0,8, 0,1, 0,08 e 0,02 respectivamente. Uma 
empresa oferece uma apólice dedutível de US$ 500. Se 
quiser que o seu lucro seja de US$ 100. que valor de 

n prêmio deve cobrar? 

36. Os n candidatos a uma vaga foram classificados co- 
mo 1, 2, 3 n. Seja X = a classificação de um can- 

didato selecionado aleatoriamente, de forma que X 
tenha fmp 


í Mn x = 1, 2, 3 
p(x) ~ j o caso contrário 
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(tal função é denominada distribuição uniforme discreta). 
Calcule E(X) e V(X), usando a fórmula alternativa. [Su- 
gestão: a soma dos primeiros n inteiros positivos é 
n(n + 1 )/2, enquanto a soma de seus quadrados éw(n+ 1 ) 
(2 n d- l)/6.] 


Seja X = resultado de um dado lançado uma vez. Se 
' /antes de lançar o dado, oferecessem a você (1/3,5) 
/ dólares ou h(X) = 1/X dólares, você aceitaria a quantia 
/ garantida ou faria a aposta? [Nota: Normalmente não é 
verdade que 1/£(X) = £(1/X).] 


Uma empresa de fornecimento de materiais químicos 
atualmente possui em seu estoque 100 libras de um 
determinado produto, vendido aos clientes em lotes de 
5 libras. Seja X = número de lotes pedidos por um 
cliente selecionado aleatoriamente e suponha que X 
tenha fmp 


X 

1 

2 3 4 

PW 

0,2 

o 

O 

O 


Calcule E(X) e V(X) e depois o número esperado de li- 
bras restantes, após o envio do pedido do próximo 
cliente, e a variância do número de libras restantes. 
(Sugestão: o número de libras restantes é uma função 
linear de X). 

39. a. Desenhe um gráfico de linhas da fmp de X do Exer- 
cício 34. Determine, então, a fmp de -X e desenhe 
seu gráfico de linhas. Considerando as duas situa- 
ções, o que você pode dizer sobre V(X) e V(-X)? 

b. Use a proposição que envolve V(aX + b) para 
definir uma relação geral entre V(X) e V(-X). 


40. Use a definição da Expressão (3.13) para demonstrar 
que V(aX + b) = a 2 • a}. [Sugestão: com h(X) = aX + 
b % E[h(X)] = afi + b onde [i — E(X).] 

41? Suponha que E(X) = 5 e E[X(X - 1)] = 27,5. Qual é 

a. E(X 2 )? [Sugestão: E[X(X - 1)] = E[X- - X] = 
E(X 2 ) - £(X)]? 

b. V(X)? 

c. A relação geral entre as quantidades £(X), E[X(X - 1 )] 
e V(X)? 

42. Escreva a regra geral para E(X - c) onde c é uma cons- 
tante. O que acontece quando você assume c = /x, o 
valor esperado de X? 

43. O resultado denominado desigualdade de Chebyshev 
diz que, para qualquer distribuição de probabilidade 
de uma va X e qualquer número k ao menos igual a 1, 
P( | X — /x | ^ ka) ^ 1 lk 2 . Em palavras, a probabili- 
dade do valor X estar a pelo menos k desvios padrão da 
média é de no máximo l/k 2 . 

a. Qual é o valor do limite superior para k = 2? k = 3? 

* = 4?* = 5?*= io? 

b. Calcule /xeo-da distribuição do Exercício 13. De- 
pois calcule P( | X - /i | > ka) para os valores de 
k fornecidos na parte (a). O que isto sugere sobre 
o limite superior em relação à probabilidade corres- 
pondente? 

c. Assuma que X possa ter três valores: -1, 0, e 1, com 
as probabilidades f, e respectivamente. Qual 
é P( | X — fi | ^ 3ít), e como ela se compara ao li- 
mite correspondente? 

d. Forneça uma distribuição para a qual P( | X - /x | > 
5(7) = 0,04. 


3.4 


Distribuição de probabilidade binomial 


Há diversos experimentos que satisfazem exatamente ou aproximadamente a seguinte lista de requisitos: 

1. O experimento consiste em uma seqüência de n experimentos menores denominados tentativas, onde n 
é estabelecido antes do experimento. 

2. Cada tentativa pode resultar em um de dois resultados possíveis (tentativas dicotômicas), chamados de 
sucesso (5) ou falha ( F ). 

3. As tentativas são independentes, de forma que o resultado de qualquer tentativa particular não influen- 
cia o resultado de qualquer outra tentativa. 

4. A probabilidade de sucesso é constante de uma tentativa para a outra. Denominamos essa probabili- 
dade p. 


DEFINIÇÃO 


Um experimento para o qual as Condições 1-4 são satisfeitas é denominado experi- 
mento binomial. 
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Exemplo 3.26 

A mesma moeda é lançada sucessiva e independentemente n vezes. Usamos S arbitrariamente para representar 
o resultado H (cara) e F para representar o resultado T (coroa). Esse experimento satisfaz, então, as Condições 
1-4. Lançar um percevejo n vezes, com S — ponta para cima e F = ponta para baixo, também resulta um ex- 
perimento binomial. ■ 

Muitos experimentos envolvem uma seqüência de tentativas independentes para as quais há mais de dois 
resultados possíveis em qualquer tentativa. Um experimento binomial pode então ser criado, dividindo-se os re- 
sultados possíveis em dois grupos. 

Exemplo 3.27 

A cor das sementes de ervilhas é determinada por um único locus genético. Se dois alelos desse locus são AA 
ou Aa (o genótipo), então a ervilha será amarela (o fenótipo) e, se o alelo for aa, será verde. Suponha que orga- 
nizemos 20 sementes Aa aos pares e cruzemos as duas ervilhas de cada par para obtenção de 10 novos genóti- 
pos. Cada novo genótipo será um sucesso S se for aa e uma falha, caso contrário. Então, com o identificador S 
ou F, o experimento será binomial com n = 10 e p = fí genótipo aa). Se cada membro do par for igualmente 
provável de contribuir com a ou A, então p = P(a) • P(a) = (y)(y) = y. I 

Exemplo 3.28 

Suponha que certa cidade tenha 50 restaurantes licenciados, dos quais atualmente 15 possuem pelo menos uma 
violação grave do código de saúde e os outros 35 não possuam violações graves. Há cinco inspetores, cada um 
dos quais inspeciona um restaurante por semana. O nome de cada restaurante é escrito em um pedaço de papel 
e, após serem misturados, cada inspetor retira um dos pedaços de papel sem reposição. A í-ésima tentativa será 
um sucesso se o í-ésimo restaurante selecionado (i = 1,..., 5) não tiver violações graves. Então 


De forma similar, é possível mostrar que P(S na í-ésima tentativa) = 0,70 para i — 3, 4, 5. Entretanto, 


O experimento não é binomial porque as tentativas não são independentes. Em geral, se a amostragem for 
feita sem reposição, o experimento não terá tentativas independentes. Se cada pedaço de papel fosse reposto após 
sua retirada, as tentativas seriam independentes, o que podia fazer com que o mesmo restaurante fosse 


P(S na primeira tentativa) = — = 0,70 


e 


P(S na segunda tentativa) = P(SS) + P(FS) 


= P(segunda S | primeira S) P( prime ira S) 

+ P( segunda S | primeira F) P(primeira F) 



( 


P(S na quinta tentativa | SSSS) = — = 0,67 


46 


enquanto 


P(S na quinta tentativa | FFFF) = — = 0,76 


46 


inspecionado por mais de um inspetor. 


Exemplo 3.29 

Suponha que certo estado tenha 500.000 motoristas cadastrados, dos quais 400.000 possuem seguro. Uma 
amostra de 10 motoristas é selecionada sem reposição. A í-ésima tentativa será S se o í-ésimo motorista tiver 
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seguro. Apesar desta situação parecer idêntica à do Exemplo 3.28, a diferença importante é que o tamanho da 
população é muito grande em relação ao tamanho da amostra. Neste caso 

P(S em 2 1 S em 1) = 399 ’ 999 = 0,80000 
499,999 

e 

P(S em 10 1 S no primeiro 9) = 399 ’ 991 = 0,799996 - 0,80000 

499,991 

Esses cálculos sugerem que, apesar das tentativas serem exatamente independentes, as probabilidades 
condicionais diferem tão pouco uma da outra que, para fins práticos, as tentativas podem ser consideradas inde- 
pendentes com P(S) = 0,8 constante. Assim, com uma boa aproximação, o experimento é binomial com n = 10 
e p - 0,8. ■ 


Usaremos a seguinte regra prática para decidir se um experimento “sem reposição” pode ser tratado como 
experimento binomial. 


REGRA 


Considere a amostragem sem reposição de uma população dicotômica de tamanho N. Se 
o tamanho da amostra (número de tentativas) n for no máximo 5% do tamanho da popu- 
lação, o experimento pode ser analisado como se fosse exatamente binomial. 


Por “analisado”, queremos dizer que as probabilidades baseadas nas hipóteses de experimento bino- 
mial estarão muito próximas das probabilidades reais “sem reposição”, que normalmente são mais difíceis de 
calcular. No Exemplo 3.28, n/N = 5/50 = 0,1 > 0,05, de forma que o experimento binomial não é uma boa 
aproximação, mas, no Exemplo 3.29, n/N = 10/500.000 < 0,05. 

Variável aleatória binomial e sua distribuição 

Na maioria dos experimentos binomiais, interessa o número total de S e não o conhecimento de exatamente quais 
tentativas resultaram em S. 


DEFINIÇÃO 


Dado um experimento binomial consistindo de n tentativas, a variável aleatória binomial 
X a ele associada é definida como 

X = quantidade de S nas n tentativas 


Suponha, por exemplo, que n = 3. Haverá, então, oito resultados possíveis para o experimento: 

SSS SSF SFS SFF FSS FSF FFS FFF 

A partir da definição de X , X(SST) = 2, X(SFF) = 1 e assim por diante. Os valores possíveis de X em um 
experimento de n tentativas são x - 0, 1,2, .... n. Freqüentemente usaremos X ~ Bin(n, p) para indicar que X é 
uma va binomial baseada em n tentativas com probabilidade de sucesso p. 


Como a fmp de uma va binomial depende de dois parâmetros n e p, representamos a fmp 
por b(x; n, p). 


NOTAÇÃO 


/ 
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Considere primeiro o caso de n = 4 para o qual cada resultado, sua probabilidade e o valor de x corres- 
pondente estão relacionados na Tabela 3.1 . Por exemplo: 

P(SSFS) — P(S) • P(S) • P(F) • P(S) (tentativas independentes) 

= p • p • (1 — p) • p ( P(S ) constante) 

= P 3 -( 1 -p) 


Tabela 3.1 Resultados e probabilidades de um experimento binominal com quatro tentativas 


Resultado 

X 

Probabilidade 

Resultado 

X 

Probabilidade 

ssss 

4 

p 4 

FSSS 

3 

p\ i -p) 

SSSF 

3 

^(í -p) 

FSSF 

2 

p\ i -pf 

SSFS 

3 

p 3 ( i -p) 

FSFS 

2 

p\ i -pf 

SSFF 

2 

p 2 ( i - p ) 2 

FSFF 

1 

Pd -p? 

SFSS 

3 

p 3 ( i - p) 

FFSS 

2 

p 3 ( i - pf 

SFSF 

2 

p 2 ( i - pf 

FFSF 

1 

Pd -pf 

SFFS 

2 

p\ i - pf 

FFFS 

1 

Pd -pf 

SFFF 

1 

p( i - pf 

FFFF 

0 

(i - pf 


Neste caso especial, queremos b(x; 4, p) para x = 0, 1, 2, 3 e 4. Para b( 3; 4 ,/?), identificamos quais dos 16 
resultados fornecem um valor de x igual a 3 e somamos as probabilidades associadas a cada resultado: 

b( 3; 4, p) = P(FSSS) + P(SFSS) + P(SSFS) + P(SSSF) = 4p\\ - p ) 

Há quatro resultados com x = 3, cada um com probabilidade p 3 ( 1 — p){ a ordem de S e F não é importante, 
apenas a quantidade 5), então 


... _ inúmero de resultados! [probabilidade de qualquer resultado 

’ ’ P — jcom X = 3 J [particular com X = 3 

De forma similar, b( 2; 4, /?) = 6/r( 1 — p) 2 , que também é o produto do número de resultados com X = 2 e 
a probabilidade qualquer de tais resultados. Em geral, 

número de seqüências de l í probabilidade de qualquer resultado 

comprimento n consistindo de x S's ] [ particular de tal sequência 

Como a ordenação de Se F não é importante, o segundo fator da equação anterior é /?'( 1 — p)"~* ( por exem- 
plo: as primeiras x tentativas resultarem em 5 e as últimas n — x resultarem em F). O primeiro fator é o número 
de maneiras de escolher x das n tentativas serem 5, isto é, o número de combinações de tamanho x que podem 
ser construídas com n objetos distintos (tentativas, no caso). 


b(x ; n, p) = 


TEOREMA 


b(x; n,p) = 

^ jp^l ~ pf x x = 0, 1 , 2, . . . n 


0 caso contrário 


Exemplo 3.30 

Cada um de seis consumidores de refrigerante selecionados aleatoriamente recebe um copo com o refrigerante 5 e 
um com o refrigerante F. Os copos são idênticos, exceto por um código no fundo que identifica o refrigerante. 
Suponha que não haja uma tendência de preferência entre os consumidores. Então p = Pium indivíduo selecionado 
prefere S) = 0,5, de forma que X = número de consumidores entre os seis que preferem S, X ~ Bin(6, 0,5). 
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Dessa forma. 


P{ X = 3) = b( 3; 6, 0,5) = ( ^ j(0,5) 3 (0,5) 3 = 20(0,5) 6 = 0,313 

A probabilidade de pelo menos três preferirem S é 

P ( 3 < X) = £ b(x ; 6, 0,5) = Í ( 6 WsmS) 6 -' = 0,656 

jt«»3 jt«3 \X) 

e a probabilidade de no máximo um preferir S é 

P(X < 1) = X b(x\ 6, 0,5) = 0,109 ■ 

x=0 


Uso das tabelas binomiais 

Mesmo para um valor relativamente pequeno de n, o cálculo da probabilidade binomial é tedioso. A Tabela 
do Apêndice A.l exibe a FDA F(x) = P(X ^ x) para n = 5, 10, 15, 20, 25 em combinação com determinados 
valores de p. Diversas outras probabilidades podem ser calculadas, usando-se a proposição de FDA da Seção 3.2. 


NOTAÇÃO 


Para X (distribuída como (o sinal é um Til. que não significa aproximadamente)) ~ Bin(n, p), 
a FDA será representada por 

X 

P(X Sí) = B(x\ n,p) = Y b(y, n, p) x = 0, 1, . . . , n 

y=0 


Exemplo 3.31 

Suponha que 20% de todas as cópias de um livro-texto apresentem falha em um determinado teste de resistên- 
cia de encadernação. Seja X o número de cópias que apresentam falhas entre 15 cópias selecionadas aleatoria- 
mente. Então X tem distribuição binomial com n = 1 5 e p = 0,2. 

1. A probabilidade de no máximo 8 apresentarem falha é 

P(X< 8) = £%; 15, 0,2) = fi( 8; 15, 0,2) 

y=0 

que é a entrada na linha x = 8 e coluna p = 0,2 da tabela binomial n = 15. Na Tabela do Apêndice A. 1 , 
a probabilidade é B( 8; 15, 0,2) = 0,999. 

2. A probabilidade de exatamente 8 apresentarem falha é 

P(X = 8) = P(X < 8) - P(X < 7) = B( 8; 15, 0,2) - fi(7; 15, 0,2) 
que é a diferença entre duas entradas consecutivas na coluna p = 0,2. 0 resultado é 0,999 - 0.996 = 0,003. 

3. A probabilidade de no mínimo 8 apresentarem falha é 

P(X > 8) = 1 - P(X < 7) = 1 - B(7; 15, 0,2) 

I _ /entrada em x = 7 \ 

ylinha da coluna p = 0,2 / 

= 1 - 0.996 = 0.004 
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4. Finalmente, a probabilidade de 4 a 7, inclusive, apresentarem falha é 

P{4 < X < 7) = P(X = 4, 5, 6 ou 7) = P(X < 7) - />(* < 3) 

= B(7; 15, 0,2) - B( 3; 15, 0,2) = 0,996 - 0,648 = 0,348 

Observe que a última probabilidade é a diferença entre as entradas nas linhas x = 7 e x = 3 e não das 
linhas x = 1 e x — 4. ■ 

Exemplo 3.32 

Um fabricante de eletrônicos alega que no máximo 10% de seus geradores precisam de reparo no período de 
garantia. Para investigar a declaração, técnicos de um laboratório de teste compraram 20 unidades e as subme- 
teram a um teste acelerado para simular o uso durante o período de garantia. Seja p a probabilidade de um ge- 
rador precisar de reparo durante o período (proporção de unidades que necessitam de reparo). Os técnicos do 
laboratório devem decidir se os dados resultantes do experimento suportam a alegação de p ^ 0,10. Seja X o 
número entre os 20 da amostra que precisam de reparo, de forma que X ~ Bin(20, p). Considere a regra 
de decisão. 

Rejeitar a alegação de p ^ 0,10 em favor da conclusão de que p > 0,10 se x S 5 (onde .téo valor ob- 
servado de X) e considerar a alegação aceitável se x ^ 4. 

A probabilidade de a alegação ser rejeitada quando p = 0,10 (conclusão incorreta) é 

P(X > 5 quando p = 0,10) = 1 - B( 4; 20, 0,1) = 1 - 0,957 = 0,043 

A probabilidade de a alegação não ser rejeitada quando p = 0,20 (tipo diferente de conclusão incorreta) é 

P( X < 4 quando p = 0,2) = B( 4; 20, 0,2) = 0,630 

A primeira probabilidade é relativamente pequena, mas a segunda é intoleravelmente grande. Quando p = 
0,20, o que significa que o fabricante errou grosseiramente para menos no percentual de unidades que necessi- 
tam de reparo, e a regra de decisão estabelecida for usada, 63% de todas as amostras serão incluídas na decla- 
ração do fabricante ser julgada aceitável! 

Pode-se pensar que a probabilidade deste segundo tipo de conclusão errônea poderia ser menor se o valor 
de corte 5 fosse alterado para outro valor na regra de decisão. Entretanto, apesar de a substituição de 5 por um 
número menor resultar em uma probabilidade menor que 0,630, a outra probabilidade aumentaria. A única forma 
de diminuir as duas “probabilidades de erro” é basear a regra de decisão em um experimento que envolva muito 
mais unidades. ■ 

Observe que um valor tabelado igual a 0 significa apenas que a probabilidade é 0 com três dígitos de sig- 
nificativos, pois todas as entradas da tabela são positivas. Programas estatísticos como o MINITAB geram b(x\ 
n, p) ou B(x ; n, p) para quaisquer valores especificados de n e p. No Capítulo 4, apresentaremos um método 
rápido e preciso de aproximações de probabilidades binomiais quando n for grande. 

Média e variância de X 

Para n = 1, a distribuição binomial se toma a distribuição de Bemoulli. Pelo Exemplo 3.17, o valor médio de uma 
variável Bemoulli é p. = p, de forma que o número esperado de S em uma tentativa única é p. Como um experi- 
mento binomial consiste de n tentativas, a intuição sugere que, para X ~ Bin(n, p), E(X) = np, o produto do número 
de tentativas pela probabilidade de sucesso em uma única tentativa. A expressão de V(À) não é tão intuitiva. 


PROPOSIÇÃO 


Se X ~ Bin(«, p), então E(X) = np, V(X) = np( 1 — p) = npq, e cr x = V npq (onde 
q=l -p). 
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Dessa forma, o cálculo da média e da variância de uma va binomial não requer o cálculo de somatórias. A 
demonstração do resultado de E(X) está esquematizada no Exercício 60. 

Exemplo 3.33 

Se 75% de todas as compras em uma determinada loja forem feitas com cartão de crédito e X for a quantidade 
de compras feitas com cartão de crédito entre 1 0 compras selecionadas aleatoriamente, então X — B in( 1 0, 0,75). 
Portanto. E(X) = np = (10)(0,75) = 7,5, V(X) = npq = 10(0,75)(0,25) = 1,875, e a = V 1,875. Novamente, 
apesar de X só poder assumir valores inteiros, E(X ) não precisa ser um inteiro. Se executarmos um grande 
número de experimentos binomiais independentes, cada um com n = 10 tentativas e p = 0,75, o número médio 
de S por experimento será próximo de 7,5. ■ 


Exercícios | Seção 3.4 (44-63) 


44. Calcule as seguintes probabilidades binomiais direta- 
mente pela fórmula de b( x; n, p ): 

a. bO\ 8, 0,6) 

b. b( 5; 8, 0,6) 

c. P(3 < X ^ 5) quando n = 8 e p = 0,6 

d. PO < X) quando n = 12 e p = 0,1 

45. Use a Tabela do Apêndice A.l para obter as probabili- 
dades a seguir: 

a. B( 4; 10, 0,3) 

b. b( 4; 10, 0,3) 

c. b( 6: 10, 0,7) 

d. P(2 < X < 4) quando X ~~ Bin( 10, 0,3) 

e. P( 2 ^ X) quando X ~~ Bin(10, 0,3) 

f. P(X ^ 1) quando X ~ Bin(10, 0,7) 

g. P( 2 < X < 6) quando X ~ Bin( 10, 0,3) 



48. Suponha que apenas 25% de todos os motoristas parem 
completamente um cruzamento com semáforos verme- 
lhos para todas as direções quando não há outros carros 
à vista. Qual é a probabilidade de que, entre 20 mo- 
toristas selecionados aleatoriamente chegando em um 
cruzamento nessas condições, 

a. no máximo seis parem totalmente? 

b. exatamente seis parem completamente? 

c. ao menos seis parem completamente? 

d. quantos dos 20 motoristas você espera que pa- 
rem completamente? 

49. O Exercício 29 (Seção 3.3) forneceu a fmp de Y, o 
número de violações do código de trânsito de um indi- 
víduo selecionado aleatoriamente com seguro de uma 
certa empresa. Qual é a probabilidade de que entre 15 
de tais indivíduos selecionados aleatoriamente, 

a. pelo menos 10 não tenham violações? 

b. menos da metade tenha ao menos uma violação? 

c. o número das pessoas com ao menos uma violação 
esteja entre 5 e 10, inclusive? 2 

50. Um determinado tipo de raquete de tênis possui duas 
versões: média e grande. Sessenta por cento de todos os 
clientes de certa loja querem a versão grande. 

a. Entre 10 clientes selecionados aleatoriamente que 
querem esse tipo de raquete, qual é a probabilidade 
de ao menos seis quererem a versão grande? 

b. Entre 10 clientes selecionados aleatoriamente, qual 
é a probabilidade de o número dos que desejam a 
versão grande estar dentro do intervalo de um desvio 
padrão da média? 

c. A loja possui atualmente sete raquetes de cada ver- 
são. Qual é a probabilidade de os 10 próximos clien- 
tes que querem essa raquete conseguirem obter a 
versão desejada do estoque atual? 

51. Vinte por cento de todos os telefones de um determi- 
nado tipo são enviados para reparo em garantia. Desses, 
60% podem ser reparados, enquanto os outros 40% 

2 “Entre a e b, inclusive” é equivalente a (a ^ X ^ b). 
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devem ser substituídos. Se uma empresa comprar 10 
desses telefones, qual é a probabilidade de exatamente 
dois serem substituídos em garantia? 

52. O College Board relata que 2% dos 2 milhões de alunos 
que fazem o SAT cada ano recebem acomodações es- 
peciais por causa de deficiência física documentada 
( Los Angeles Times , July 16, 2002). Considere uma 
amostra aleatória de 25 estudantes que fizeram o tes- 
te recentemente. 

a. Qual é a probabilidade de exatamente 1 ter recebido 
acomodação especial? 

b. Qual é a probabilidade de ao menos 1 ter recebido 
acomodação especial? 

c. Qual é a probabilidade de ao menos 2 terem rece- 
bido acomodação especial? 

d. Qual é a probabilidade de o número entre os 25 que 
receberam acomodação especial estar dentro de 2 
desvios padrão do número que você espera se- 
rem acomodados? 

e. Suponha que um estudante que não receba aco- 
modação especial tenha 3 horas para fazer o exame 
e um que receba tenha 4,5. Qual você espera que 
seja o tempo médio dos 25 estudantes selecionados? 

53. Suponha que 90% de todas as pilhas de certo fabricante 
tenham voltagens aceitáveis. Um determinado tipo de 
lanterna necessita de duas pilhas tipo D, e ela só fun- 
ciona se as duas pilhas tiverem voltagem aceitável. En- 
tre 10 lanternas selecionadas aleatoriamente, qual é a 
probabilidade de pelo menos nove funcionarem? Que 
hipótese você fez no decorrer da resposta à pergun- 
ta proposta? 

54. Um grande lote de componentes chegou em um dis- 
tribuidor e só pode ser classificado como aceitável se 
a proporção de componentes com defeito for no má- 
ximo 0,10. O distribuidor decide selecionar 10 com- 
ponentes aleatoriamente e aceitar o lote apenas se o 
número de componentes defeituosos da amostra for no 
máximo 2. 

a. Qual é a probabilidade de o lote ser aceito quando a 
proporção real de itens com defeito for 0,01? 0,05? 
0,10? 0,20? 0,25? 

b. Seja p a proporção real de itens com defeito no lote. 
Um gráfico de P(lote é aceito) em função de p, com 
p no eixo horizontal e Pilote é aceito) no eixo verti- 
cal é denominado curva característica de operação 
do plano de aceitação da amostragem. Use os resul- 
tados da parte (a) para fazer o gráfico da curva para 

0<p< 1. 

c. Repita as partes (a) e (b) com “1” substituindo “2” 
no plano de aceitação da amostragem. 

d. Repita as partes (a) e (b) com “15” substituindo “10” 
no plano de aceitação da amostragem. 

e. Qual dos três planos de amostragem é mais satis- 
fatório e por quê? 

55. Uma norma que exige a instalação de um detector de 
fumaça em todas as casas construídas anteriormente 


está em vigor há um ano em certa cidade. O corpo de 
bombeiros está preocupado porque muitas casas con- 
tinuam sem detectores. Seja p = proporção real de 
casas que possuem detectores e suponha que uma 
amostra aleatória de 25 lares seja inspecionada. Se a 
amostra indica fortemente que pouco menos de 80% de 
todas as casas possuem detector, o corpo de bombeiros 
fará uma campanha por um programa de inspeção obri- 
gatória. Por causa do custo do programa, o corpo de 
bombeiros prefere não pedir essas inspeções a menos 
que a amostra renda evidências fortes que comprovem 
sua necessidade. Seja X o número de casas com detec- 
tores entre as 25 da amostra. Considere rejeitar a 
hipótese de p > 0,8 se x ^ 15. 

a. Qual é a probabilidade de a hipótese ser rejeitada se 
o valor real de p for 0,8? 

b. Qual é a probabilidade de não rejeitar a hipótese 
quando p = 0,7? Quando p = 0,6? 

c. Como as “probabilidades de erro” das partes (a) e 
(b) mudam se o valor 1 5 na regra de decisão for al- 
terado para 14? 

56. Uma ponte cobra um pedágio de US$ 1,00 para carros 
de passeio e de US$ 2,50 para outros veículos. Suponha 
que, durante o dia, 60% de todos os veículos sejam car- 
ros de passeio. Se 25 veículos cruzarem a ponte durante 
um determi fiado período do dia, qual será a receita es- 
perada resultante? [Sugestão: Seja X = número de car- 
ros de passeio. A receita total h(X) é uma função linear 
deX.] 

57. ) Um estudante que está tentando escrever um trabalho 

para um curso tem a escolha de dois tópicos: A e B. Se o 
aluno escolher o tópico A, solicitará dois livros por 
empréstimo da biblioteca, e, se escolher B, serão solicita- 
dos quatro livros. O estudante acredita que, para escrever 
um bom trabalho, precisa receber e usar ao menos meta- 
de dos livros selecionados para cada tópico escolhido. Se 
a probabilidade de um livro solicitado chegar em tempo 
for de 0,9 e os livros chegam independentemente um do 
outro, que tópico o aluno deve escolher para maximizar 
a probabilidade de escrever um bom artigo? E se a 
probabilidade for de apenas 0,5 em vez de 0,9? 

58. a. Para n determinado, há valores de p (0 ^ p ^ 1) 

para os quais V(X) = 0? Explique, 
b. Para que valor de p V(X) é maximizada? [ Sugestão : 
faça o gráfico de V(X) em função de p ou calcule 
a derivada.] 

59. a. Demonstre que b( jc; n, 1 — p) = b(n - x; n, p). 

b. Demonstre que B(x\ n, 1 — p) = 1 — B(n — x - 1; 
n } p). [ Sugestão : no máximo xS’s serão equivalentes 
a pelo menos ( n — x) F’s.] 

c. O que as partes (a) e (b) implicam sobre a necessi- 
dade de se incluir valores de p maiores do que 0,5 na 
Tabela A.l do Apêndice? 

60. Demonstre que £(X) = np quando X é uma variável 
aleatória binomial. [Sugestão: primeiro expresse E(X) 
como uma soma com limite inferior x = 1. Depois fatore 
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np, assumindo y = x - 1 de forma que a soma varie de 
y = 0 ay = n — le mostre que a soma é igual a 1 .] 

61. Os clientes de um posto de gasolina pagam com cartão 
de crédito (A), cartão de débito (B) ou dinheiro (C). As- 
suma que clientes sucessivos façam escolhas indepen- 
dentes, com P(A) = 0,5, P(B) = 0,2 e P(C) = 0,3. 

a. Entre os próximos 100 clientes, qual será a média e 
a variância do número dos que pagam com cartão de 
débito? Explique seu raciocínio. 

b. Responda à parte (a) para o número entre os 100 que 
não pagam em dinheiro. 

62. Uma limusine de aeroporto pode acomodar até quatro 
passageiros em qualquer corrida. A empresa aceitará 
um máximo de seis reservas e os passageiros devem ter 
reservas. Pelos registros anteriores, 20% de todos os 
que fazem reservas não aparecem para a corrida. Res- 
ponda as seguintes perguntas, assumindo independên- 
cia quando apropriado. 


a. Se forem feitas seis reservas, qual é a probabilidade 
de ao menos um indivíduo com reserva não poder 
ser acomodado na corrida? 

b. Se forem feitas seis reservas, qual é o número espe- 
rado de lugares disponíveis quando a limusine parte ? 

c. Suponha que a distribuição de probabilidade do 
número de reservas feitas seja dada na tabela 
a seguir. 


Número de reservas 

3 

4 

5 

6 

Probabilidade 

0,1 

0,2 

0,3 

0,4 


Seja X = número de passageiros de uma corrida sele- 
cionada aleatoriamente. Calcule a função de dis- 
tribuição de probabilidade de X. 

63. Refira-se à desigualdade de Chebyshev fornecida no 
Exercício 43. Calcule P( \ X — /i\ ^ kor) para Jfe = 2e 
k = 3 quando X ~ Bin(20, 0,5) e compare com o limite 
superior correspondente. Repita para X ~ Bin(20, 0,75). 


3.5 


Distribuições binomiais hipergeométrica e negativa 


As distribuições binomiais hipergeométrica e negativa são ambas intimamente relacionadas à distribuição bino- 
mial. Enquanto a distribuição binomial é o modelo aproximado de amostragem sem reposição de uma população 
(S-F) dicotômica finita, a distribuição hipergeométrica é o modelo de probabilidade para o número de S's em 
uma amostra. A va binomial X é o número de S quando o número de tentativas n está estabelecido, enquanto a 
distribuição binomial negativa resulta da fixação do número de S desejado, deixando que o número de tentativas 
seja aleatório. 


Distribuição hipergeométrica 

As hipóteses que levam à distribuição hipergeométrica são as seguintes: 

1. A população ou o conjunto de onde é retirada a amostra consiste de N indivíduos, objetos ou elementos 
(população finita ). 

2. Cada indivíduo é classificado como sucesso (5) ou falha (F) e há M sucessos na população. 

3. É selecionada uma amostra sem reposição de n indivíduos de forma que cada subconjunto de tamanho 
n seja igualmente provável de ser escolhido. 

A variável aleatória de interesse é X = número de S's na amostra. A distribuição de probabilidade de X de- 
pende dos parâmetros n, M e N, de forma que queremos calcular P(X = x) = h(x\ n, M, N). 

Exemplo 3.34 

Durante determinado período, um escritório de tecnologia da informação de uma universidade recebeu 20 or- 
dens de serviço de problemas com impressoras, das quais 8 de impressoras a laser e 12 a jato de tinta. Uma 
amostra de 5 dessas ordens de serviço será selecionada para inclusão em uma pesquisa de satisfação do cliente. 
Suponha que as 5 sejam selecionadas de forma completamente aleatória para que qualquer subconjunto de 
tamanho 5 tenha a mesma possibilidade de ser selecionado (imagine colocar os números 1, 2,..., 20 em 20 tar- 
jas de papel, misturá-las e escolher cinco delas). Qual será a probabilidade de exatamente x (x = 0, 1, 2, 3, 4 ou 
5) das ordens de serviço selecionadas serem de impressoras a jato de tinta? 
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Neste exemplo, o tamanho da população é N = 20, o tamanho da amostra é n = 5 e o número de 5 (jato de 
tinta = 5) e Fda população são M = 12 e /V — A/ = 8, respectivamente. Considere o valor x = 2. Como todos 
os resultados (cada um consistindo em 5 ordens) são igualmente prováveis. 


P(X = 2) = h( 2; 5, 12, 20) = 


número de resultados com X = 2 
número de resultados possíveis 


O número de resultados possíveis no experimento é o número de maneiras de selecionar 5 dos 20 objetos 
sem se importar com a ordem, isto é, ( 2 “). Para contar o número de resultados tendo X = 2, observe que há (?) 
formas de selecionar 2 das ordens de serviço de impressoras a jato de tinta e para cada forma há (*) maneiras de 
selecionar as 3 ordens de serviço de impressoras a laser para completar a amostra. A regra do produto do Capí- 
tulo 2 fornece então (!?)(*) como o número de resultados com X = 2, assim 



Em geral, se o tamanho da amostra n for menor que o número de sucessos da população (Aí), o maior valor 
possível de X será n. Entretanto, se M < n (por exemplo, uma amostra de tamanho 25 e apenas 15 sucessos na 
população), então X pode ser no máximo M. De forma similar, sempre que o número de falhas da população 
( N — M) exceder o tamanho da amostra, o menor valor possível de X será 0 (porque todos os indivíduos da 
amostra podem ser falhas). Entretanto, se N - M < n, o menor valor possível de X será n - (N - M). Resu- 
mindo, os valores possíveis de X satisfazem à restrição máx.(0, n — (N — M)) S x ^ mín.(n, M). Um argumento 
paralelo ao do exemplo anterior fornece a fmp de X. 


PROPOSIÇÃO 

Se X for o número de S de uma amostra completamente aleatória de tamanho n tirada de 
uma população constituída de M S's e(N - M) F's, então a distribuição de probabilidade 
de X , denominada distribuição hipergeométrica, será dada por 


/M\/N — M\ 



P(X -x)~ h(x; n, M, N) — UA 

o 

(3.15) 


\ n ) 

para um inteiro x que satisfaça máx.(0. n — N + M) ^ x ^ mín.(n, M). 



No Exemplo 3.34, n = 5. M = 12 e N = 20, de forma que h(x; 5, 12, 20) para x = 0, 1, 2, 3, 4, 5 pode ser 
obtida, substituindo-se esses números na Equação (3.15). 

Exemplo 3.35 

Cinco indivíduos de uma população animal supostamente ameaçada de extinção em certa região foram captura- 
dos, marcados e liberados para se misturarem à população. Após terem uma oportunidade de cruzarem, foi sele- 
cionada uma amostra aleatória de 10 desses animais. Seja X = número de animais marcados na segunda amostra. 
Se, na verdade, houver 25 animais desse tipo na região, qual será a probabilidade de (a) X = 2? (b) X £ 2? 

Os valores dos parâmetros são n = 10, M = 5 (5 animais marcados na população) e N = 25, assim 



x = 0, 1, 2, 3, 4, 5 
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Para a parte (a). 


Para a parte (b), 


P(X = 2) = h( 2; 10, 5, 25) = 



0,385 


P(X <2) = m = 0, 1 , ou 2) = X h(x; 10, 5, 25) 

*=o 


= 0,057 + 0,257 + 0,385 = 0,699 


Estão disponíveis tabelas abrangentes da distribuição hipergeométrica, mas, como a distribuição possui três 
parâmetros, as tabelas requerem muito mais espaço do que as da distribuição binomial. O MINITAB e outros 
programas estatísticos geram probabilidades hipergeométricas facilmente. 

Como no caso binomial, há expressões simples para E{X) e V(X) para vas hipergeométricas. 


PROPOSIÇÃO A média e a variância da va hipergeométrica X com fmp h( x\ n, M, AO são 

E(X) = n- — V(X) = ( ^ ~ M • ra • — • (l - — ) 
N \N- 1 ) N \ N) 


A razão M/N é a proporção de S na população. Se substituirmos M/N por p em E(X) e V(X), obtemos 

E{X) = np 

/ N — n\ ( 3I6) 

A Expressão (3.16) mostra que as médias das vas binomial e hipergeométrica são iguais, enquanto as va- 
riâncias das duas vas diferem pelo fator (N — n)/(N — 1 ), freqüentemente denominado fator de correção de 
população finita. Esse fator é menor do que 1, de forma que a variável hipergeométrica tem variância menor do 
que a va binomial. O fator de correção pode ser escrito como (1 — n/N)/( 1 - 1/AO, que é aproximadamente 1 
quando n é pequeno em relação a N. 

Exemplo 3.36 (Continuação do Exemplo 3.35) 

No exemplo de marcação dos animais, n = 10, M = 5, e N = 25, de forma que p = ^ = 0,2 e 

E{X) = 10(0,2) = 2 

V(X) = 1|(10)(0,2)(0,8) = (0,625)(1,6) = 1 
Se a amostragem fosse feita com reposição, V(X) = 1,6. 

Suponha que o tamanho da população N não seja conhecido, de forma que o valor x é observado e quere- 
mos estimar N. É razoável igualar a proporção da amostra observada de S, x/n, à proporção da população, M/N, 
fornecendo a estimativa 


N - 


M • n 


Se M = 100, n = 40 e x = 16, então N = 250. 


x 
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Nossa regra prática geral da Seção 3.4 afirmava que, se a amostragem foi feita sem reposição mas n/N era 
no máximo 0,05, a distribuição binomial podia ser usada para calcular probabilidades aproximadas, envolvendo 
o número de S na amostra. Segue uma definição mais precisa: considere que o tamanho da população iVeo 
número S's da população M, cresçam à medida que a relação M/N aproxima-se de p. Então h(x; n y M, N) se apro- 
xima de b(x; n , p). Para n/N pequeno, os dois são aproximadamente iguais, desde que p não esteja muito perto 
tanto de 0 como de 1 . Essa é a base de nossa regra prática. 

Distribuição Binomial Negativa 

A va e a distribuição binomial negativa são baseadas em experimentos que satisfaçam às condições a seguir: 

1. O experimento consiste de uma seqüência de tentativas independentes. 

2. Cada tentativa resulta em sucesso (S) ou em falha ( F ). 

3. A probabilidade de sucesso é constante de uma tentativa para outra, então P(S na tentativa i) = p para 
i = 1,2,3.... 

4. O experimento continua (as tentativas são executadas) até ser observado um total de r sucessos, sendo r 
um inteiro positivo. 

A variável aleatória de interesse é X = número de falhas que precedem o r-ésimo sucesso. X é denominada 
variável aleatória binomial negativa porque, em contraste com a va binomial, o número de sucessos é fixo e 
o de tentativas é aleatório. 

Valores possíveis de X são 0, 1, 2 Represente por nb(x\ r, p) a fmp de X. O evento {X = x} é equiva- 

lente a {r — I S's nas primeiras (x + r — 1) tentativas e um 5 na (x + r)ésima tentativa} (por exemplo: se r - 5 
e x = 10, deve haver quatro 5 nas primeiras 14 tentativas e a tentativa 15 deve ser um S). Como as tentativas 
são independentes, 

nb(x\ r, p) — P(X = x) 

= P(r — 1 S's nas primeiras x + r — 1 tentativas) • P(S) (3.17) 

A primeira probabilidade do membro direito da Expressão (3.17) é a probabilidade binomial 

I* + r [_ j * jp r "'(l ~ PY onde P(S) = p 


PROPOSIÇÃO 


A fmp da va binomial negativa X com parâmetros r = número de S's e p — P(S) é 
nb(x; r ’P) = (^ X+ r [_ j 1 j/> r U ~ PY x = 0, 1, 2, . . . 


Exemplo 3.37 

Um pediatra deseja convocar cinco casais, cada um esperando seu primeiro filho, para participarem de um novo 
regime de parto natural. Seja p = P (um casal selecionado aleatoriamente concorda em participar). Se p = 0,2, 
qual é a probabilidade de 15 casais serem solicitados antes de serem encontrados cinco que concordem em par- 
ticipar? Isto é, com S = {concorda em participar), qual é a probabilidade de ocorrerem 10 F antes do quinto 5? 
Substituindo r = 5, p = 0,2 e x = 10 em nb(x; r y p) y temos 


nb( 10; 5, 0,2) = ( ^ j(0,2) 5 (0,8) 10 = 0,034 
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A probabilidade de no máximo 10 F serem observados (no máximo 15 casais serem entrevistados) é 

10 10 / Y + 4 \ 

P(X < 10) = 2 nb(x- 5, 0,2) = (0,2) 5 1 , (0,8)* = 0,164 ■ 

a=o *=o\ 4 / 

Em algumas fontes de informações, a va binomial negativa é considerada como o número de tentativas X 
+ r em vez de número de falhas. 

No caso particular de r = 1, a fmp é 

nb(x; l,p) = (1 - p) x p x = 0,1,2,... (3.18) 

No Exemplo 3.10, deduzimos a fmp em relação ao número de tentativas necessárias para se obter o 
primeiro S e aquela fmp é semelhante à Expressão (3.18). Tanto X = número de Fcomo Y = número de tenta- 
tivas ( = 1 + X) são denominadas variáveis aleatórias geométricas na literatura especializada e a fmp da Ex- 
pressão (3.18) é denominada distribuição geométrica. 

No Exemplo 3.18, foi demonstrado que o valor esperado de tentativas até a obtenção do primeiro 5 é l/p, de 
forma que o valor esperado de F até a obtenção do primeiro 5 é ( l/p) — 1 = ( 1 — p)íp. Intuitivamente, esperaríamos 
ver r • ( 1 — p)/p F antes do r-ésimo S e esta é, na verdade, £(X).Também há uma fórmula simples para V(X). 


PROPOSIÇÃO 


Se X é uma va binomial negativa com fmp nb( x; r, p), então 

E(X) = r(1 ~ p) V(X) = ~P ) 

P P- 


Finalmente, desenvolvendo o coeficiente binomial de p r ( 1 - pY e fazendo algumas simplificações, vê-se 
que nb(x\ r, p) é bem definido, mesmo quando r não é inteiro. Verifica-se que a distribuição binomial negativa 
geral ajusta muito bem os dados observados em uma grande variedade de aplicações. 


Exercícios Seção 3.5 (64-74) 

64. Certo tipo de câmera digital é oferecida em duas ver- 
sões de três megapixel e quatro megapixel. Uma loja de 
câmeras recebeu uma encomenda de 15 dessas câme- 
ras, das quais seis com resolução de três megapixel. 
Suponha que cinco delas sejam selecionadas aleatoria- 
mente para serem estocadas atrás do balcão. As outras 
10 são colocadas na área de armazenagem. Seja X = 
número de câmeras de três megapixel entre as cinco se- 
lecionadas para armazenagem atrás do balcão. 

a. Que tipo de distribuição tem X (nome e valores de 
todos os parâmetros)? 

b. Calcule P(X = 2), P(X < 2) e P(X > 2). 

c. Calcule o valor médio e o desvio padrão de X. 

65. Doze refrigeradores de um determinado tipo foram de- 
volvidos ao distribuidor por causa de um ruído audível, 
oscilante e agudo que faziam quando em funciona- 
mento. Suponha que sete desses refrigeradores pos- 
suam um compressor defeituoso e os outros cinco te- 
nham problemas graves. Se os refrigeradores forem 
examinados em ordem aleatória, seja X o número de 
refrigeradores examinados entre os seis primeiros com 


compressores defeituosos. Calcule os seguintes 
valores: 

a. P(X = 5) 

b. P(X< 4) 

c. A probabilidade de X exceder o valor da média em 
mais de 1 desvio padrão. 

d. Considere uma entrega de 400 refrigeradores, dos 
quais 40 possuem compressores com defeito. Se X 
for o número de compressores defeituosos entre 15 
refrigeradores selecionados aleatoriamente, descre- 
va uma forma menos cansativa de calcular (ao me- 
nos aproximadamente) P(X < 5) em vez de usar a 
fmp hipergeométrica. 

66. Um instrutor que lecionou estatística para engenheiros 
para duas turmas no semestre passado, a primeira com 20 
alunos e a segunda com 30, decidiu pedir aos alunos um 
projeto semestral. Após a entrega de todos os projetos, o 
instrutor os organizou aleatoriamente antes de corrigi-los. 
Considere os primeiros 1 5 projetos a serem corrigidos, 
a. Qual é a probabilidade de exatamente 10 projetos 
serem da segunda turma? 


118 


Probabilidade e Estatística - Editora Thomson 


b. Qual é a probabilidade de pelo menos 10 projetos 
serem da segunda turma? 

c. Qual é a probabilidade de ao menos 10 projetos 
serem da mesma turma? 

d. Qual é o valor médio e o desvio padrão do número 
de projetos entre esses 15 que pertencem à segun- 
da turma? 

e. Qual é o valor médio e o desvio padrão do número 
de projetos que não estão entre os 15 primeiros que 
pertencem à segunda turma ? 

67. Um geólogo coletou 10 amostras de rocha basáltica 
e 10 de granito. Instruiu o geólogo assistente de labo- 
ratório para selecionar aleatoriamente 15 amostras pa- 
ra análise. 

a. Qual é o número de amostras de granito seleciona- 
das para análise? 

b. Qual é a probabilidade de todas as amostras de um dos 
dois tipos de rocha serem selecionadas para análise? 

c. Qual é a probabilidade de o número de amostras de 
granito selecionadas para análise estarem dentro de 
1 desvio padrão do valor médio? 

68. Um diretor de pessoal que entrevistará 1 1 engenheiros 
seniores para quatro cargos marcou seis entrevistas para 
o primeiro dia e cinco para o segundo. Assuma que os 
candidatos serão entrevistados em ordem aleatória. 

a. Qual é a probabilidade de x dos quatro melhores 
candidatos serem entrevistados no primeiro dia? 

b. Dos quatro melhores candidatos, quantos podem ser 
esperados para entrevistas no primeiro dia? 

69. Vinte pares de indivíduos inscritos em um torneio de 
bridge foram designados com os números 1,..., 20. Na 
primeira parte do torneio, os 20 pares são divididos alea- 
toriamente em 10 pares leste-oeste e 10 pares norte-sul. 

a. Qual é a probabilidade de x dos 10 melhores pares 
jogarem leste-oeste? 

b. Qual é a probabilidade de todos os cinco melhores 
pares jogarem na mesma direção? 

c. Se há 2n pares, qual é a fmp de X = número entre os 
n melhores pares que jogam leste-oeste? Quais são 
E(X) e V(X)? 


70. Um alerta de poluição de segundo estágio foi feito em 
uma determinada área de Los Angeles County, onde há 
50 indústrias. Um inspetor visitará 10 indústrias sele- 
cionadas aleatoriamente para verificação de violações 
dos regulamentos. 

a. Se 15 empresas realmente estiverem violando ao 
menos um regulamento, qual é a fmp do número de 
empresas visitadas pelo inspetor que estão violando 
ao menos um regulamento? 

b. Se houver 500 empresas na área, das quais 1 50 com 
violação, faça a aproximação da fmp da parte (a) 
para uma fmp mais simples. 

c. Para X = número entre as 10 empresas visitadas 
que estão violando os regulamentos, calcule E(X) e 
V(X) para a fmp exata e aproximada na parte (b). 

71. Suponha que p = P(nascimento de menino) = 0,5. Um 
casal quer ter exatamente duas meninas e terá filhos até 
essa condição ser satisfeita. 

a. Qual é a probabilidade de a família ter x fi- 
lhos homens? 

b. Qual é a probabilidade de a família ter quatro filhos? 

c. Qual é a probabilidade de a família ter no máximo 
quatro filhos? 

d. Quantos filhos homens espera-se que essa família 
tenha? Quantos filhos espera-se que essa famí- 
lia tenha? 

72. Uma família decide ter filhos até ter três do mesmo 
sexo. Assumindo P(H) = P(M) = 0,5, qual é a fmp de 
X = número de filhos na família? 

73. Três irmãos e suas esposas decidem ter filhos até que 
cada família tenha duas meninas. Qual é a fmp de X = 
número total de filhos homens nascidos nas famílias? 
Qual é E(X) e como pode ser comparada ao número 
esperado de filhos nascidos em cada família? 

74. O indivíduo A tem um dado vermelho e B tem um 
verde (ambos justos). Se cada um lançar o dado até 
obterem cinco “duplas” (1-1, ... , 6-6), qual será a fmp 
de X = número total de vezes que um dado é lançado? 
Quais são E(X) e V(X)? 


3.6 I Distribuição de probabilidade de Poisson 

As distribuições binomial, hipergeométrica e binomial negativa foram deduzidas a partir de um experimento 
consistindo de tentativas ou retiradas e na aplicação das leis da probabilidade aos diversos resultados do expe- 
rimento. Não há um experimento simples que sirva de base para a distribuição de Poisson, apesar de des- 
crevermos simplificadamente como ela pode ser obtida por meio de certas operações limitantes. 


DEFINIÇÃO 


Uma variável aleatória X tem distribuição de Poisson com parâmetro À (À > 0) se a fmp 
de X for 


p(x; À) = 


g~ A A' 

x\ 


x = 0, 1,2, . . . 
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Geralmente, o valor de À é uma taxa por unidade de tempo ou por unidade de área. A letra e em p(x\ À) é 
a base dos logaritmos naturais. Seu valor numérico é aproximadamente 2,71828. Como À é positivo, p{x\ À) > 
0 para todos os valores possíveis de x. O fato de 2,% 0 p(x; À) = 1 é uma conseqüência da expansão de e A da série 
infinita de Maclaurin, que aparece na maioria dos livros-texto de cálculo: 

12 A- 1 oo \x 

e A = 1 +À + + • • • = £ ~ (3.19) 

2! 3! ,=o x\ 

Se os dois termos extremos da Expressão (3.19) forem multiplicados por e k e depois e' k for colocado den- 
tro da somatória, o resultado será 


1 = 2 *" A 

-r=0 


Al 

x\ 


o que mostra que p(x\ À) satisfaz a segunda condição necessária para definir uma fmp. 


Exemplo 3.38 

Seja X o número de certo tipo de animais capturados em uma armadilha durante certo período de tempo. 
Suponha que X tenha uma distribuição de Poisson com À = 4.5, de forma que, em média, cada armadilha con- 
tém 4,5 animais. [O artigo “Dispersai Dynamics of the Bivalve Gemma Gemma in a Patchy Environment ( Eco - 
logical Monographs, 1995, p. 1-20) sugere esse modelo. O bivalvo Gemma gemma é um pequeno molusco], A 
probabilidade de uma armadilha conter exatamente cinco animais é 


P(X = 5) = 


g- 4 - s (4,5) s 

5! 


= 0,1708 


A probabilidade de uma armadilha conter no máximo cinco animais é 


P(X < 5) = 2 — = e-* 5 \ 1 + 4,5 + + • • • + 11^11 

,-o Jt! L 2! 5! 


= 0,7029 


A distribuição de Poisson como um limite 

A base lógica para o uso da distribuição de Poisson em muitas situações é fornecida pela proposição a seguir. 


PROPOSIÇÃO 


Suponha que na fmp binomial b{x\ n, p), tenhamos n — » * e p — » 0 de tal forma que np se 
aproxime de um valor À > 0. Então b(x\ n, p) — > p(x\ A). 


De acordo com essa proposição, em qualquer experimento binomial em que n é grande epé pequeno, b(x, n,p ) *» 
p(x\ À), onde À = np. Como regra prática, tal aproximação pode ser aplicada se n > 100, p s 0,01 e np £ 20. 


Exemplo 3.39 

Se uma editora de livros não-técnicos se esforça para garantir que seus livros não possuem erros tipográficos, de 
forma que a probabilidade de uma página conter um erro desse tipo é de 0,005 e os erros são independentes de 
página para página, qual é a probabilidade de um de seus romances de 400 páginas conter exatamente uma 
página com erros? No máximo três páginas com erros? 

Com S representando uma página com ao menos um erro e F uma página sem erros, o número X de páginas 
que contém ao menos um erro é uma va binomial com n = 400 e p = 0,005, de forma que np = 2. Queremos 


P(X = 1) = b{ 1; 400, 0,005) * p{ 1; 2) = 


SH2 )' 


1 ! 


= 0,271 
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De forma similar, 

3 3 

P(X < 3) « 2p( Jt; 2) = X e ~ 2 — = 0,135 + 0,271 + 0,271 + 0,180 

x=0 *=o jc! 

= 0,857 ■ 

A Tabela A.2 do Apêndice mostra a FDA F( x; A) para À =0,1; 0,2;..., 1, 2;..., 10; 15 e 20. Por exemplo: se 
A = 2, então P(X s 3) = F( 3; 2) = 0,857, como no Exemplo 3.39, enquanto P(X = 3) = F( 3; 2) — F( 2; 2) = 
0,180. De forma alternativa, muitos programas estatísticos geraram p(x\ A) e F(x\ A) quando solicitado. 


Média e variância de X 

Como b(x ; n, p) — > p(.r; A) quando n — > oc, p — > 0, np — » A, a média e a variância de uma variável binomial ten- 
dem para as de uma variável de Poisson. Os limites são np — » A e np(l — p) — » A. 


PROPOSIÇÃO 


Se X tiver distribuição de Poisson com parâmetro A, então E(X) = V(X) = A. 


Esses resultados também podem ser deduzidos diretamente das definições de média e variância. 

Exemplo 3.40 (Continuação do Exemplo 3.38) 

Tanto o número de animais capturados como a variância dessa quantidade são iguais a 4,5 e o* = VÃ = 

VT3 = 2,12. ■ 


Processo de Poisson 

Uma aplicação muito importante da distribuição de Poisson surge juntamente com a ocorrência de eventos de 
um tipo particular no decorrer do tempo. Como exemplo, suponha que, iniciando em um instante denominado 
t = 0, estejamos interessados em contar o número de pulsos radioativos registrados em um contador Geiger. 
Façamos as seguintes hipóteses sobre a maneira como os pulsos ocorrem: 

1. Existe um parâmetro a > 0 tal que, para qualquer intervalo de tempo curto At, a probabilidade de ser 
recebido exatamente um pulso é a - At + o(At). 3 

2. A probabilidade de ser recebido mais de um pulso durante At é o(At) [que, juntamente com a Hipótese 
1 implica que a probabilidade de nenhum pulso durante At é 1 — a • At — o(Aí)]. 

3. O número de pulsos recebidos durante o intervalo de tempo At é independente da quantidade recebida 
antes do intervalo de tempo. 

Informalmente, a Hipótese 1 diz que, para um intervalo de tempo curto, a probabilidade de se receber um 
único pulso é aproximadamente proporcional à duração do intervalo de tempo, onde a é a constante de propor- 
cionalidade. Seja agora P k (t) a probabilidade de serem recebidos k pulsos pelo contador durante um intervalo de 
tempo de duração t. 


PROPOSIÇÃO 


F*(0 = e~ a> • (at) l /kl. de forma que o número de pulsos durante um intervalo de tempo t é 
uma va de Poisson com parâmetro A = at. O número esperado de pulsos durante qualquer 
um de tais intervalos de tempo será então at, de forma que o número esperado durante uma 
unidade de intervalo de tempo será a. 


3 Uma quantidade é o(A/) (leia “o minúsculo de delta D se, à medida que A/ se aproxima de 0, o(A/)/A/ também o faz. Isto é, o(Ar) é ainda mais des- 
prezível que o próprio A/. A quantidade (A/) 2 possui essa propriedade, mas sen(A/) nào. 


Variáveis Aleatórias Discretas e Distribuições de Probabilidade - Jay l. Devore 121 


Exemplo 3.41 

Suponha que os pulsos cheguem no contador em uma taxa média de seis por minuto, de modo que a = 6. Para 
determinar a probabilidade de pelo menos um pulso ser recebido em um intervalo de meio minuto, observe que 
o número de pulsos em tal intervalo tem distribuição de Poisson com parâmetro at = 6(0,5) = 3 (0,5 min. é 
usado porque a é expresso como taxa por minuto). Então, sendo X = número de pulsos recebidos no intervalo 
de 30 segundos. 


P(\ < X) = 1 - P(X = 0) = 1 - g 3(3) ° = 0,950 ■ 

0! 

Se nas Hipóteses 1-3 substituirmos “pulso” por “evento”, então o número de eventos que ocorrem durante um 
intervalo de tempo fixo t tem distribuição de Poisson com parâmetro at. Qualquer processo que tenha essa dis- 
tribuição é denominado processo de Poisson e a é denominada taxa do processo. Outros exemplos de situações 
que originam um processo de Poisson incluem monitoramento do estado de um sistema de computadores ao longo 
do tempo, com as quebras constituindo os eventos de interesse; registro do número de acidentes em uma instalação 
industrial ao longo do tempo, tempo de resposta em uma central telefônica; e observação da quantidade de chu- 
veiros de raios cósmicos em um determinado observatório ao longo do tempo. 

Em vez de observar eventos ao longo do tempo, considere apenas observar eventos de um determinado tipo 
que ocorrem em uma região bi ou tridimensional. Por exemplo: podemos selecionar uma determinada região R 
de uma floresta em um mapa ir para aquela região e contar o número de árvores. Cada árvore representa um 
evento que ocorre em um ponto certo no espaço. Com hipóteses similares a 1-3, podemos demonstrar que o 
número de eventos que ocorrem em uma região R tem distribuição de Poisson com parâmetro a • a(R), onde a(R) 
é a área de R. A quantidade a é o número esperado de eventos por unidade de área ou de volume. 


Exercícios | Seção 3.6 (75-89) 

75. Seja X o número de falhas na superfície de uma caldeira 
de um determinado tipo selecionada aleatoriamente, 
com distribuição de Poisson de parâmetro À = 5. Use a 
Tabela A.2 do Apêndice para calcular as probabilidades 
a seguir: 

a. P(X < 8) b. P(X = 8) c. P { 9 < X) 
d. P( 5<X<8) e. P( 5 < X < 8) 

76. Suponha que o número X de tomados observados em 
uma determinada região durante o período de um ano 
tenha uma distribuição de Poisson com A = 8. 

a. Calcule P(X < 5). 

b. Calcule P(6 < X < 9). 

c. Calcule P( 10 ^ X). 

d. Qual é a probabilidade de o número observado de 
tomados exceder o número esperado por mais de 1 
desvio padrão? 

77. Suponha que o número de motoristas que trafega entre 
certa origem e destino durante um período de tempo de- 
terminado tenha uma distribuição de Poisson com 
parâmetro À = 20 (sugerido no artigo “Dynamic Ride 
Sharing: Theory and Practice,” J. of Transp. Engr, 
1997, p. 308-312). Qual é a probabilidade de o número 
de motoristas ser: 

a. No máximo 10? 

b. Exceder 20? 


c. Estar entre 10 e 20, inclusive? Estar estritamente en- 
tre 10 e 20? 

d. Estar dentro de dois desvios padrão do valor médio? 

78. Considere gravar algo em um disco rígido e enviá-lo 
para um certificador contar o número de pulsos ausen- 
tes. Suponha que esse número X tenha uma distribuição 
de Poisson com parâmetro A = 0,2. (Sugerido em 
“Average Sample Number for SemiCurtailed Sampling 
Using the Poisson Distribution,” J. Quality Technology , 
1983, p. 126-129). 

a. Qual é a probabilidade de um disco ter exatamente 
um pulso ausente? 

b. Qual é a probabilidade de um disco ter dois pul- 
sos ausentes? 

c. Se dois discos forem selecionados de forma indepen- 
dente, qual é a probabilidade de nenhum conter pul- 
sos ausentes? 

79. Um artigo no Los Angeles Times (3 de dezembro de 
1993) relata que 1 em 200 pessoas possui o gene reces- 
sivo que causa câncer de cólon hereditário. Em uma 
amostra de 1 000 indivíduos, qual é a distribuição aproxi- 
mada do número dos que possuem o gene? Use essa dis- 
tribuição para calcular a probabilidade aproximada de: 

a. Entre 5 e 8 (inclusive) possuírem o gene. 

b. Ao menos 8 possuírem o gene. 
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80. Suponha que apenas 0,10% de todos os computado- 
res de certo tipo apresentem falhas de CPU durante o 
período de garantia. Considere uma amostra de 10.000 
computadores. 

a. Qual é o valor esperado e o desvio padrão do nú- 
mero de computadores da amostra que apresentam 
defeito? 

b. Qual é a probabilidade (aproximada) de mais de 10 
computadores da amostra apresentarem defeito? 

c. Qual é a probabilidade (aproximada) de nenhum 
computador da amostra apresentar defeito? 

81. Suponha que pequenas aeronaves pousem em um aero- 
porto. de acordo com um processo de Poisson, com a 
taxa a = 8 por hora, de forma que o número de pousos 
durante um período de tempo de r horas é uma va de 
Poisson com parâmetro A = 8/. 

a. Quais são a probabilidade de exatamente seis aero- 
naves pequenas chegarem durante um período de 
uma hora? Ao menos seis? Ao menos 10? 

b. Qual é o valor esperado e o desvio padrão do núme- 
ro de pequenas aeronaves que chegam durante um 
período de 90 minutos? 

c. Qual é a probabilidade de ao menos 20 aeronaves 
pequenas chegarem durante um período de 2\ horas? 
De no máximo 10 chegarem nesse período? 

82. O número de pessoas que chegam para tratamento em 
um pronto-socorro pode ser modelado por um processo 
de Poisson com taxa de cinco por hora. 

a. Qual é a probabilidade de exatamente quatro pes- 
soas chegarem em certa hora? 

b. Qual é a probabilidade de ao menos quatro pessoas 
chegarem em certa hora? 

c. Quantas pessoas você espera que cheguem em um 
período de 45 minutos? 

83. O número de solicitações de assistência recebido por 
um serviço de guincho é um processo de Poisson com 
taxa a = 4 por hora. 

a. Calcule a probabilidade de exatamente dez solici- 
tações chegarem em um certo período de 2 horas. 

b. Se os operadores do serviço de guincho tirarem 
30 minutos para almoço, qual é a probabilidade 
de não perderem nenhum chamado de assistência? 

c. Quantas ligações você espera que ocorram durante 
o almoço? 

84. Em testes de placas de circuitos, a probabilidade de 
falha em um diodo é de 0,01. Suponha que uma placa 
de circuito contenha 200 diodos. 

a. Quantos diodos espera-se que apresentem falhas e 
qual é o desvio padrão desse valor? 

b. Qual é a probabilidade (aproximada) de ao menos 
quatro diodos apresentarem falha em uma placa se- 
lecionada aleatoriamente? 

c. Se cinco placas forem enviadas a um determinado 
cliente, qual é a probabilidade de ao menos quatro 
funcionarem corretamente? (Uma placa só fun- 


ciona corretamente se todos os seus diodos fun- 
cionarem.) 

85. O artigo “Reliability-Based Service-Life Assessment of 
Aging Concrete Structures" (7. Structural Engr . , 1993, 

р. 1600- 1621 ) sugere que um processo de Poisson pode 
ser usado para representar a ocorrência de cargas estru- 
turais no tempo. Suponha que o tempo médio entre as 
ocorrências de cargas seja 0,5 ano. 

a. Quantas cargas podem ser esperadas durante um 
período de dois anos? 

b. Qual é a probabilidade de mais de cinco cargas ocor- 
rerem durante um período de dois anos? 

с. Quanto tempo deve ter um período para que a pro- 
babilidade de não ocorrerem cargas seja no máxi- 
mo 0,1? 

86. Seja X uma distribuição de Poisson com parâmetro A. 
Demonstre que E(X) = A diretamente da definição de 
valor esperado. ( Sugestão : O primeiro termo da soma é 
igual a 0, então x pode ser cancelado. Fatore A e mostre 
que o restante soma 1.) 

87. Suponha que as árvores sejam distribuídas em uma flo- 
resta de acordo com um processo bidimensional de 
Poisson com parâmetro a. O número esperado de ár- 
vores por acre é igual a 80. 

a. Qual é a probabilidade de que em um quarto de acre 
haja no máximo 16 árvores? 

b. Se a floresta cobrir 85.000 acres, qual será o número 
esperado de árvores na floresta ? 

c. Suponha que você selecione um ponto na floresta e 
construa um círculo de raio 0,1 milha. Seja X = 
número de árvores na região circular. Qual é a fmp 
de X? ( Sugestão : 1 milha quadrada = 640 acres.) 

88. Automóveis chegam em uma estação de inspeção de 
equipamentos veiculares de acordo com um proces- 
so de Poisson com taxa ar = 10 por hora. Suponha 
que, com probabilidade 0,5, um veículo chegue sem 
violações de equipamento. 

a. Qual é a probabilidade de exatamente 10 veículos 
chegarem durante uma hora e nenhum ter vio- 
lações? 

b. Para qualquer y > 10 fixo, qual é a probabilidade 
de y veículos chegarem em uma hora, todos sem 
violações? 

c. Qual é a probabilidade de 10 carros sem violações 
chegarem na próxima hora? [Sugestão: Some as 
probabilidades na parte (b) entre v = 10 e <*>.] 

89. a. Em um processo de Poisson, o que deve acontecer no 

intervalo de tempo (0, t) e no intervalo (r, t + Ar) 
para que nenhum evento ocorra em todo o intervalo 
(0, t + Ar)? Use esta Hipótese e as Hipóteses 1-3 
para escrever a relação entre P 0 (t + Ar) e P 0 (t). 
b. Use o resultado da parte (a) para escrever uma ex- 
pressão para a diferença P 0 (t 4- Ar) - P 0 (t). Divida 
então por Ar e considere que Ar -» 0 para obter uma 
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equação envolvendo ( dJdt)P 0 (t) y derivada de P 0 (t) em 
relação a t. 

c. Verifique se P 0 (t) = e~ at satisfaz à equação da 
parte (b). 

d. Pode-se demonstrar de forma similar às partes (a) e 
(b) que as P k (t) devem satisfazer ao sistema de 
equações diferenciais. 


4 P t (t) = aP k ,(/) - aP k (l) 

dl 

Jfc = 1, 2, 3, 

Verifique se P k (t) = e a '(atf/k'. satisfaz ao sistema. 
(Na verdade, esta é a única solução.) 


Exercícios suplementares (90-1 1 6) 


90. Considere um baralho formado por sete cartas, mar- 
cadas 1, 2, ... , 7. Três dessas cartas são selecionadas 
aleatoriamente. Defina uma va W como W = soma dos 
números resultantes e calcule a fmp de W. Depois, cal- 
cule fx e cr 1 , [Sugestão: Considere os resultados como 
não-ordenados, de forma que ( 1, 3, 7) e (3, 1,7) não se- 
jam considerados resultados diferentes. Então haverá 
35 resultados que podem ser relacionados. (Esse tipo de 
va, na verdade, surge juntamente com o teste de hipó- 
tese denominado teste de soma de postos de Wilcoxon, 
em que há uma amostra x e uma amostra ycWé a soma 
dos postos dos x na amostra combinada.)] 

91. Após embaralhar um baralho de 52 cartas, um crupiê dá 
cinco cartas. Seja X = número de naipes representados 
na mão de cinco cartas. 

a. Mostre que a fmp de X é 


X 

1 

2 

3 

4 

P(X ) 

0,002 

0,146 

0,588 

0,264 


[Sugestão: p( 1) = 4P( todos de espadas), p( 2) = 6P( ape- 
nas espadas e copas com no mínimo um de cada) e p( 4) 
= 4P(2 espadas f! um de cada outro naipe).] 

b. Calcule p, a 2 , e cr. 

92. A va binomial negativa X foi definida como o número 
de F f s antes do r-ésimo 5. Seja Y = número de tentati- 
vas necessárias para obtenção do r-ésimo S. Da mesma 
forma que a fmp de X foi deduzida, deduza a fmp de Y. 

93. De todos os clientes que compram portões automáti- 
cos de garagem, 75% compram um modelo acionado 
por corrente. Seja X = número entre os próximos 
15 compradores que selecionam o modelo acionado 
por corrente. 

a. Qual é a fmp de X? 

b. Calcule P(X> 10). 

c. Calcule P( 6 < X < 10). 

d. Calcule p e a 2 

e. Se a loja atualmente tiver em estoque 10 modelos 
acionados por corrente e oito acionados por eixo, qual 
é a probabilidade de os pedidos desses 15 clientes 
serem todos atendidos com o estoque existente? 

94. Um amigo recentemente planejou uma viagem para um 
acampamento. Ele tinha duas lanternas, uma que exigia 
uma pilha de 6V e outra que usava duas pilhas tamanho 


D. Ele já havia colocado na mala duas pilhas de 6V e 
quatro tamanho D. Suponha que a probabilidade de 
uma determinada pilha funcionar seja p e que as pilhas 
funcionam ou não, independentemente uma da outra. 
Nosso amigo quer levar apenas uma lanterna. Para que 
valores de p ele deve levar a lanterna de 6V? 

95. Um sistema k-de-n funciona se, e somente se, pelo 
menos k dos n componentes individuais do sistema 
funcionarem. Se os componentes individuais funcionam 
independentemente um do outro, cada um com proba- 
bilidade 0,9, qual é a probabilidade de um sistema 3-de- 
5 funcionar? 

96. Um fabricante de pilhas de lanterna deseja controlar a 
qualidade de seus produtos rejeitando os lotes em que 
a proporção de pilhas com voltagem inaceitável seja 
muito alta. Assim, em cada lote grande (10.000 pilhas), 
25 serão selecionadas e testadas. Se ao menos cinco 
delas gerarem voltagens inaceitáveis, todo o lote será 
rejeitado. Qual é a probabilidade de um lote ser re- 
jeitado se 

a. 5% das pilhas do lote tiverem voltagens ina- 
ceitáveis? 

b. 10% das pilhas do lote tiverem voltagens inacei- 
táveis? 

c. 20% das pilhas do lote tiverem voltagens ina- 
ceitáveis? 

d. O que aconteceria às probabilidades nas partes 
(aMc) se o número critico de rejeição fosse au- 
mentado de 5 para 6? 

97. Das pessoas que passam por um detector de metal de 
um aeroporto, 0,5% o ativam. Seja X = número de 
pessoas que ativam o detector entre um grupo de 500 
selecionado aleatoriamente. 

a. Qual é a fmp (aproximada) de X? 

b. Calcule P(X = 5). 

c. Calcule P( 5 ^ X). 

98. Uma empresa de consultoria educacional está ten- 
tando decidir se alunos de ensino médio que nunca 
usaram uma calculadora podem resolver um tipo de 
problema mais facilmente com uma calculadora que 
usa lógica polonesa reversa ou com uma que não a 
usa. Uma amostra de 25 alunos é selecionada e eles 
podem praticar em ambas as calculadoras. Então, cada 
aluno é solicitado a resolver um problema com a 
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calculadora polonesa reversa e um similar com a outra. 
Seja p = P(S ), onde S indica que o aluno resolveu o 
problema mais rapidamente com a lógica polonesa re- 
versa do que com a outra e seja X = número de S's. 

a. Sc p = 0,5, qual é P(7 < X < 18)? 

b. Se p = 0,8, qual é P(1 < X < 18)? 

c. Se a Hipótese p = 0,5 for rejeitada quando X < 7 
ou X> 18, qual é a probabilidade de rejeitar a 
hipótese quando ela estiver correta? 

d. Se a decisão de rejeitar a hipótese p = 0,5 for como 
na parte (c), qual é a probabilidade de ela não ser 
rejeitada quando p = 0,6? E quando p = 0,8? 

e. Que regra de decisão você escolheria para rejeitar a 
hipótese p = 0,5 se você quisesse que a proba- 
bilidade da parte (c) fosse no máximo 0,01? 

99 . Considere uma doença cuja presença pode ser identifi- 
cada por um teste sangüíneo. Seja p a probabilidade de 
um indivíduo selecionado aleatoriamente ter a doença. 
Suponha que n indivíduos sejam selecionados indepen- 
dentemente para teste. Uma forma de proceder é fazer 
um teste separado para cada uma das n amostras 
sangüíneas. Uma abordagem potencialmente mais 
econômica — teste em grupo — foi apresentada du- 
rante a Segunda Guerra Mundial para identificar 
homens com sífilis entre recrutas do exército. Primeiro, 
separe parte de cada amostra de sangue, misture-as e 
faça um único teste. Se ninguém tiver a doença, o re- 
sultado será negativo e apenas um teste terá sido 
necessário. Se ao menos um indivíduo tiver a doença, o 
teste da amostra misturada resultará positivo e nesse 
caso serão processados os n testes individuais. Se p = 
0,1 e n = 3, qual será o número esperado de testes 
usando esse procedimento? Qual será o número espe- 
rado quando n = 5? [O artigo “Random Multiple Ac- 
cess Communication and Group Testing” (IEEE Trans. 
on Commun ., 1984, p. 769-77 4) aplicou essas idéias a 
um sistema de comunicação em que a dicotomia era 
usuário ativo/ocioso em vez de doente/não-doente.] 

100 . Seja p ] a probabilidade de qualquer símbolo de certo 
código ser transmitido com erro em um sistema de co- 
municação. Assuma que os erros ocorram em símbo- 
los diferentes, independentemente um do outro. 
Suponha também que com probabilidade p 2 , o símbolo 
errado seja corrigido no recebimento. Seja X o número 
de símbolos corrigidos em um bloco de mensagem 
consistindo de n símbolos (após o final do processo de 
correção). Qual é a distribuição de probabilidade de 
X? 

101. O comprador de um gerador exige c partidas conse- 
cutivas antes de acertar a unidade. Assuma que os re- 
sultados das partidas individuais sejam independentes 
um do outro. Seja p a probabilidade de certa partida 
ter sucesso. A variável aleatória de interesse é X = 
número de partidas que devem ser processadas antes 
da aceitação. Forneça a fmp de X para o caso c = 2. Se 
p = 0,9, qual será P(X < 8)? [Sugestão: para x ^ 5, 


expresse p(x) “de forma recursiva” em termos da fmp 
calculada com os valores menores x — 3, jc — 4, . . . , 
2.] (Esse problema foi sugerido pelo artigo “Evalua- 
tion of a Start-Up Demonstration Test,” J. Quality 
Technology , 1983, p. 103-106.) 

102 . Um plano de fidelidade de viagens de executivos foi 
desenvolvido por uma companhia aérea sob a pre- 
missa de que 10% de seus clientes atuais se qualifi- 
cariam para participar. 

a. Admitindo a validade dessa premissa, entre 25 
clientes atuais selecionados aleatoriamente, qual é 
a probabilidade de entre 2 e 6 (inclusive) se qualifi- 
carem para o programa? 

b. Admitindo novamente a validade da premissa, qual 
é o número esperado de clientes que se qualificam e 
o desvio padrão do número dos que se qualificam 
em uma amostra aleatória de 100 clientes? 

c. Seja X o número em uma amostra de 25 clientes 
atuais que se qualificam para o programa. Con- 
sidere rejeitar a premissa da empresa na hipótese de 
p > 0,10 se x > 7. Qual é a probabilidade de a pre- 
missa da empresa ser rejeitada quando for válida? 

d. Refira-se à regra de decisão apresentada na parte 
(c). Qual é a probabilidade de a premissa da em- 
presa não ser rejeitada mesmo que p = 0,20 (ou 
seja, 20% se qualificam)? 

103 . Quarenta por cento das sementes de milho possuem 
espigas simples e as outras 60%, espigas duplas. Uma 
semente com espiga simples produzirá uma planta com 
espigas simples em 29% das vezes, enquanto uma se- 
mente com espiga dupla produzirá uma planta com es- 
pigas simples em 26% das vezes. Considere a seleção 
aleatória de 10 sementes. 

a. Qual é a probabilidade de exatamente cinco dessas 
sementes terem espiga única e produzirem uma 
planta com espigas únicas? 

b. Qual é a probabilidade de exatamente cinco es- 
pigas possuírem espigas únicas? Qual é a proba- 
bilidade de no máximo cinco plantas terem 
espigas únicas? 

104 . Um julgamento não resultou em veredicto, porque oito 
membros do júri eram favoráveis ao veredicto de cul- 
pado e os outros quatro eram favoráveis ao de ab- 
solvição. Se os jurados saírem da sala aleatoriamente 
e cada um dos quatro primeiros for interpelado por um 
repórter buscando uma entrevista, qual será a fmp de 
X = número de jurados favoráveis à absolvição, entre 
os entrevistados? Quantos dos favoráveis à absolvição, 
você espera que sejam entrevistados? 

105 . Um serviço de reservas emprega cinco operadores 
de informações que recebem solicitações de informa- 
ções independentemente um do outro de acordo com 
um processo de Poisson com taxa a = 2 por minuto, 
a. Qual é a probabilidade de que, durante certo 

período de 1 minuto, o primeiro operador não re- 
ceba solicitações? 
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b. Qual é a probabilidade de que, durante certo 
período de um minuto, quatro dos cinco operadores 
não recebam solicitações? 

c. Escreva uma expressão para a probabilidade de em 
um dado período de um minuto, todos os opera- 
dores recebam exatamente o mesmo número de 
solicitações. 

106. Gafanhotos distribuem-se aleatoriamente em um vasto 
campo, de acordo com uma distribuição de Poisson, 
com parâmetro a = 2 por jarda quadrada. Qual é o 
tamanho do raio R de uma região amostrai circular 
para que a probabilidade de se encontrar pelo menos 
um gafanhoto na região seja de 0,99? 

107. Uma banca de jornal faz o pedido de cinco cópias de 
uma edição de certa revista de fotografia. Seja X = 
número de indivíduos que chegam para comprar a re- 
vista. Se X tiver distribuição de Poisson com parâmetro 
À = 4, qual será o número esperado de cópias vendidas? 

108. Os indivíduos A e B começam a jogar uma seqüência 
de partidas de xadrez. Seja S = { A ganha a partida} e 
suponha que os resultados de partidas sucessivas se- 
jam independentes com P(S) = p e P(F) = 1 - p 
(nunca há empate). Eles jogarão até que um ganhe 10 
partidas. Seja X = número de partidas jogadas (com 
valores possíveis 10, 11,..., 19). 

a. Para x = 10, 11,..., 19, obtenha a expressão de 
P(x) = P(X = jc). 

b. Se puder haver empates, com p = P(S ), q = P(F ), 
1 — p ~ q = P (empate), quais serão os valores 
possíveis de X? Qual é P( 20 < X)? [Sugestão: 
P( 20 < X) = 1 - P(X< 20).] 

109. Certo teste de presença de uma certa doença tem pro- 
babilidade 0,20 de fornecer um resultado positivo 
falso (indicando que o indivíduo tem a doença quando 
não for o caso) e probabilidade 0,10 de fornecer um 
resultado negativo falso. Suponha que 10 indivíduos 
sejam testados, cinco dos quais têm a doença e cinco 
não. Seja X = número de resultados positivos. 

a. X tem distribuição binomial? Explique seu ra- 
ciocínio. 

b. Qual é a probabilidade de exatamente três dos 10 
resultados serem positivos? 

110. A fmp geral da binomial negativa é dada por 

nb(x\ n p) = k(r, x) • p r {\ - p)' 
x = 50, 1,2, ... 

Seja X o número de certo tipo de planta encontrada em 
uma determinada região, calcule a distribuição para p 
= 0,3 e r = 2,5. Qual é P(X = 4)? Qual é a probabi- 
lidade de ao menos uma planta ser encontrada? 

111. Defina uma função p(x; X, p) por 

p(x; 4 \i p) 


caso contrário 


a. Mostre que p(x: À, p) satisfaz às duas condições 
necessárias para especificação de uma fmp. [Nota: 
Se uma empresa emprega dois digitadores, um dos 
quais comete erros tipográficos na taxa de A por 
página e o outro na taxa de p por página e cada um 
deles faz metade do trabalho de digitação da em- 
presa, então p( jc; À, p) é a fmp de X = número de 
erros em uma página selecionada aleatoriamente.] 

b. Se o primeiro digitador (taxa A) digita 60% de to- 
das as páginas, qual é a fmp de X da parte (a)? 

c. Qual é E(X) de p(x\ A, p) dado por essa expressão? 

d. Qual é o valor de a 2 de p( jc; A, p) obtido por 
aquela expressão? 

112. A moda de uma variável aleatória discreta X com fmp 
p(x) é o valor x* para o qual p(x) é o maior (o valor 
mais provável de jc). 

a. Seja X ~ Bin(/i, p). Considerando a razão b(x + 
1 ; n, p)/b(j c; n, p), demonstre que b(x\ n, p) aumenta 
com x, desde que x < np — ( 1 - p). Conclua que a 
moda jc* é o inteiro que satisfaz (n + 1 )p — 1 < 
jc* < (n + 1 )p. 

b. Demonstre que, se X tem distribuição de Poisson 
com parâmetro A, a moda é o maior inteiro menor 
que A. Se A for um inteiro, mostre que A — 1 e A 
são modas. 

113. O dispositivo de armazenagem de um computador 
possui 10 faixas concêntricas numeradas 1, 2, ..., 10 da 
mais externa para a mais interna e um único braço de 
acesso. Seja p t = a probabilidade de certa solicitação 
de dados levar o braço para a faixa i ( i = 1,...,10). As- 
suma que as faixas acessadas em buscas sucessivas são 
independentes. Seja X = número de faixas sobre as 
quais o braço de acesso passa durante duas solici- 
tações sucessivas (excluindo a faixa da qual o braço 
acaba de sair, de forma que os valores possíveis de X 
são x = 0, 1,..., 9). Calcule a fmp de X. [Sugestão: P( o 
braço está na faixa i e X = j) = P(X = j | braço em 
0 • p r Após a probabilidade condicional ser expressa 
em termos de p l0 pela lei da probabilidade total, 
a probabilidade desejada é obtida pela somatória dos 
valores /.] 

114. Se X é uma va hipergeométrica, demonstre direta- 
mente pela definição que E(X) = nM/N (considere 
apenas o caso n < Aí). [Sugestão: Fatore tiM/N na 
soma de E(X) e mostre que os termos da soma têm a 
forma h(y ; n - 1, M - 1, N - 1), onde y = jc - 1.] 

115. Use o fato de 

2 (* ” p) 2 p(x) ^ 2 (x- p) 2 p(x) 

todos x x: | x — fi | zzkar 

para demonstrar a desigualdade de Chebyshev dada no 
Exercício 43. 

116. O processo de Poisson simples da Seção 3.6 é carac- 
terizado por uma taxa constante a em que os eventos 
ocorrem por unidade de tempo. Uma generaliza- 
ção disso é supor a probabilidade de ocorrência de 


0 
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exatamente um evento no intervalo [t, t + Ar] é a(t) • 
A t + o(At). Pode-se, então, demonstrar que o número 
de eventos que ocorrem durante um intervalo [í,, t 2 \ 
tem uma distribuição de Poisson com parâmetro 

f'2 

A = a(t) dt 

A ocorrência de eventos ao longo do tempo nessa 
situação é denominada processo de Poisson não - 
homogêneo. O artigo “Inference Based on Retrospec- 


tive Ascertainment”, J. Amer Stat. Assoe., 1989, p. 
360-372, considera a função intensidade 

a(t) = e a+bt 

apropriada para eventos que envolvem a transmissão 
do HIV (vírus da AIDS) via transfusões de sangue. 
Suponha que a = 2 e b = 0,6 (próximos aos valores 
sugeridos no artigo), com o tempo em anos. 

a. Qual é o número esperado de eventos no intervalo 
[0, 4]? Em [2, 6]? 

b. Qual é a probabilidade de no máximo 15 eventos 
ocorrerem no intervalo [0, 0,9907]? 
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Variáveis Aleatórias 
Contínuas e Distribuições 
de Probabilidade 


Introdução 

Como mencionado no inicio do Capítulo 3, nem todas as variáveis aleatórias são discretas. 
Neste capítulo, estudamos o segundo tipo geral de variável aleatória que aparece em di- 
versos problemas práticos. As Seções 4.1 e 4.2 apresentam as definições básicas e as pro- 
priedades das variáveis aleatórias contínuas e suas distribuições de probabilidades. Na 
Seção 4.3, estudamos em detalhe a variável aleatória normal e sua distribuição, inques- 
tionavelmente a mais importante e útil da probabilidade e estatística. As seções 4.4 e 4.5 
discutem outras distribuições contínuas frequentemente usadas no trabalho prático. Na 
Seção 4.6, apresentamos um método de avaliação da consistência dos dados da amostra 
com a distribuição especificada. 


4.1 


Variáveis Aleatórias Contínuas e Funções 
de Densidade de Probabilidade 


Uma variável aleatória (va) é discreta se os seus valores possíveis constituírem tanto um conjunto finito como 
puderem ser relacionados em uma seqüência infinita (uma lista em que haja um primeiro elemento, um segundo 
etc.). Uma variável aleatória cujo conjunto de valores possíveis consiste de um intervalo completo de números 
não é discreta. 

Variáveis Aleatórias Contínuas 


DEFINIÇÃO 


Uma variável aleatória X é dita contínua se o seu conjunto de valores possíveis consistir 
do intervalo completo de todos os valores, isto é, se, para cada A < B, qualquer valor x en- 
tre A e B for possível. 
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Exemplo 4.1 

Se no estudo de ecologia de um lago fizermos medidas de profundidade em locais selecionados aleatoriamente, 
então X = profundidade nesse local é uma va contínua. Neste caso, A é a profundidade mínima na região da 
amostragem e B é a profundidade máxima. I 

Exemplo 4.2 

Se um composto químico for selecionado aleatoriamente e determinarmos seu pH X, então, X é uma va contínua 
porque qualquer valor de PH entre 0 e 14 é possível. Caso se saiba mais sobre o composto selecionado para 
análise, o conjunto de valores possíveis pode ser um subintervalo de [0, 14], tal como 5,5 ^ x ^ 6,5, mas X ainda 
seria contínua. I 

Se a escala de medida de X puder ser subdividida tanto quanto se desejar, a variável será contínua. Caso 
contrário, a variável será discreta. Por exemplo: se a variável for altura ou comprimento, poderá ser medida em 
quilômetros, metros, centímetros e assim por diante, de forma que a variável é contínua. Se, entretanto, X = 
valor de uma conta de gás mensal selecionada aleatoriamente, a menor unidade de medida será o centavo, 
fazendo com que qualquer valor de X seja um múltiplo de US$ 0,01 e X seja uma variável discreta. 

Alguém pode argumentar que variáveis como altura, peso e temperatura, apesar de serem, em princípio, 
contínuas, na prática, as limitações dos instrumentos de medida nos restringem a um mundo discreto (embora 
possa ser bastante subdividido). Entretanto, os modelos contínuos normalmente se aproximam muito bem de 
situações do mundo real e a matemática contínua (cálculo) freqüentemente se mostra mais fácil de trabalhar do 
que a matemática de variáveis e distribuições discretas. 

Distribuições de Probabilidade de Variáveis Contínuas 

Suponha que a variável de interesse X seja a profundidade de um lago em um ponto da superfície escolhido 
aleatoriamente. Seja M = profundidade máxima (em metros), de modo que qualquer número do intervalo [0, Aí] 
seja um valor possível de X. Se “considerarmos X discreta", arredondando a profundidade para o valor mais 
próximo de metro, então os valores possíveis são inteiros não-negativos menores ou iguais a M. A distribuição 
discreta resultante das profundidades pode ser ilustrada usando-se um histograma de probabilidade. Se dese- 
nharmos o histograma de forma que a área do retângulo acima de qualquer inteiro possível k seja a proporção 
do lago cuja profundidade seja k (com arredondamento para o metro seguinte), então a área total de todos os 
retângulos será 1. Um histograma possível é exibido na Figura 4.1 (a). 

Se a profundidade for medida com arredondamento para o centímetro seguinte e for usado o mesmo eixo 
de medidas da Figura 4. l(a), cada retângulo no histograma de probabilidades será muito mais estreito, apesar da 
área total de todos os retângulos permanecer 1. Um histograma possível é ilustrado na Figura 4. l(b). Sua aparên- 
cia é mais ajustada do que o histograma da Figura 4.1 (a). Se continuarmos executando medidas de forma mais 
e mais precisa, a seqüência resultante terá uma curva cada vez mais ajustada, como a ilustrada na Figura 4.1(c). 
Como, para cada histograma, a área de todos os retângulos é igual a 1 , a área total sob a curva ajustada também 
é 1 . A probabilidade de a profundidade em um ponto selecionado aleatoriamente estar entre a e b é igual à área 
sob a curva ajustada entre os dois referidos pontos a e b.É exatamente uma curva ajustada do tipo ilustrado na 
Figura 4. 1 (c) que especifica uma distribuição de probabilidade contínua. 



Figura 4.1 (a) Histograma de probabilidade da profundidade medida com arredondamento em metros, 

(b) histograma de probabilidade da profundidade medida com arredondamento em centímetros; (c) limite de 

uma sequência de histogramas discretos 
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DEFINIÇÃO 


Seja X uma va contínua. A distribuição de probabilidade ou função de densidade de 
probabilidade (fdp) de X será. então, uma função /(*) tal que, para quaisquer dois 
números atb com a £ b, 

P(a <X<b)= f f(x) dx 

7 a 

Isto é, a probabilidade de X ter um determinado valor no intervalo [ a , b] é a área contida 
entre o intervalo e abaixo da curva da função de densidade, conforme ilustrado na Figura 
4.2. O gráfico de/(.r) normalmente é denominado curva de densidade. 


f(x) 



a b 

Figura 4.2 P(a < X < b) = a área abaixo da curva de densidade, entre a e b 


Para que /( j t) seja uma fdp legítima, deve satisfazer às duas condições a seguir: 

1. f(x) ^ 0 para todos os x 

2. /(j c) dx = área abaixo do gráfico def(x) 

J — oo 


Exemplo 4.3 

A direção de uma imperfeição em relação a uma linha de referência em um objeto circular como um pneu, um 
rotor de freio ou um volante normalmente apresenta alguma incerteza. Considere a linha de referência que 
conecta a válvula do pneu até o ponto central e seja X o ângulo medido no sentido horário até o local da imper- 
feição. Uma fdp possível de X é 



0^x< 360 
caso contrário 


A fdp está ilustrada na Figura 4.3. Claramente, /( jc) 2: 0. A área abaixo da curva de densidade é apenas a 
área de um retângulo: (altura)(base) = (^)(360) = 1. A probabilidade de o ângulo estar entre 90° e 180° é 

fWO I r *=180 1 

P( 90 180) = — dx= — =-= 0,25 

3 90 360 360 xm90 4 

A probabilidade de o ângulo de ocorrência estar dentro de 90° da linha de referência é 
P(0 < X < 90) + P(270 < X < 360) = 0,25 + 0,25 = 0,50 


ffx) f(x) 

Área sombreada = P(90 ^ X ^ 1 80) 



Figura 4.3 A fdp e a probabilidade do Exemplo 4.3 


270 


360 
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Como sempre 0Sa<i< 360 no Exemplo 4.3, P(a < X < b) depende apenas da largura b — a do inter- 
valo, X é dita ter distribuição uniforme. 


DEFINIÇÃO 


Uma va contínua X é dita ter distribuição uniforme no intervalo [4, B] se a fdp de X for 


f(x\ A, B) = | B — A 

l 0 


A<x<B 
caso contrário 


O gráfico de qualquer fdp uniforme possui a aparência do gráfico da Figura 4.3, exceto pelo fato de que o 
intervalo da densidade positiva é [A, B] em vez de [0, 360]. 

No caso discreto, uma função de massa de probabilidade (fmp) nos diz como as pequenas “falhas” 
daquele tipo de massa, de diversas magnitudes, estão distribuídas de modo contínuo ao longo do eixo das me- 
didas. No caso contínuo, a densidade da probabilidade está “suja” de forma contínua ao longo do intervalo de 
valores possíveis. Quando a densidade está mantida uniformemente ao longo do intervalo, resulta uma fdp 
uniforme, como na Figura 4.3. 

Quando X é uma va discreta, é designada uma probabilidade positiva a cada valor possível, mas este não é 
o caso quando X é contínua. 


PROPOSIÇÃO 


Se X é uma va contínua, então para qualquer número c, P(X = c) = 0. Além disso, para 
quaisquer dois números azb com a < b, 

P(a<X<b) = P(a<X< b) (41 

= P(a<X<b) = P(a<X<b) 


Em palavras, a probabilidade atribuída a qualquer valor específico é zero e a probabilidade de um intervalo 
não depende da inclusão ou não de seus pontos extremos. Essas propriedades decorrem dos fatos de que a área 
abaixo do gráfico de f(x) e acima do único valor c é nula, e que a área sob o gráfico acima de um intervalo não 
é afetada pela exclusão ou inclusão dos pontos extremos do intervalo. Se X for discreta e houver uma massa de 
probabilidade positiva tanto em X = a como em X = b, então as quatro probabilidades da Expressão (4. 1 ) 
diferirão uma da outra. 

O fato de uma distribuição contínua atribuir probabilidade zero para cada valor tem uma analogia física. 
Considere uma haste circular sólida com área da seção = 1 pol 2 . Posicione a haste ao longo do eixo das medi- 
das e suponha que sua densidade em qualquer ponto x seja dada pelo valor f(x) de uma função de densidade. En- 
tão, se a haste for seccionada nos pontos a e b e o segmento removido, a quantidade de massa removida é /£/(*) 
dx. Se a haste for cortada apenas no ponto c, nenhuma massa será removida. A massa é atribuída a segmentos 
do intervalo da haste, mas não a pontos individuais. 


Exemplo 4.4 

‘Tempo de avanço” no fluxo do tráfego é o tempo entre o instante em que um carro termina de passar por um 
ponto fixo e o instante em que o próximo carro começa a passar por esse ponto. Seja X = tempo de avanço para 
dois carros consecutivos escolhidos ao acaso, em uma estrada durante um período de tráfego intenso. A 
seguinte fdp de X é essencialmente a sugerida em “The Statistical Properties of Freeway Traffic” ( Transp . Re- 
search, vol. 11, p. 221-228): 


m = { 


0,15e~° ,l5<x-0,5) 

0 


x s 0,5 
caso contrário 
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0 gráfico de f(x) é mostrado na Figura 4.4. Não há densidade associada aos tempos de avanço inferio- 
res a 0,5 e a densidade do avanço decresce exponencialmente rápida à medida que x aumenta a partir de 0,5. 
Claramente, f(x) s 0. Para mostrar que Jü» f(x) dx = 1 , usamos a expressão do cálculo J* e~ L ' dx = ( llk)e t a . 
Então 


J f(x) dx = J n5 0,15e' o l5<J ‘ °- 3) dx = 0,15e° 075 | o5 e' 015 ’ dx 


= 0 , 1 5<? 0075 • 


_ ^-<0.I5)(0.5> _ 1 

0,15 


/<*)» 



Figura 4.4 A curva de densidade do tempo de avanço do Exemplo 4.4 

A probabilidade do tempo de avanço ser no máximo 5 segundos é 

P(X <5) = f[ f(x) dx = J’ 5 0,15<?-° 15( '- 0 - 5> <£t 


= 0,15c 0075 f e- 0 ' 5 * dx = 0,1 5c° 

’ J 0,5 


1.075 . _ . 


«-0,15.x 


x—5 

*=0.5 


J 0,15 

= e ao75 (-e-°- 75 + e~° 075 ) = 1 ,078(-0,472 + 0,928) = 0,491 

® C - 

= P( menos de 5 segundos) = P(X < 5) 


Diferentemente das distribuições discretas, tais como a binomial, a hipergeométrica e a binomial negativa, 
a distribuição de qualquer va contínua dada normalmente não pode ser deduzida por meio de argumentos pro- 
babilísticos simples. Pelo contrário, deve-se fazer uma escolha cuidadosa da fdp com base em conhecimentos 
anteriores e dados disponíveis. Felizmente, há algumas famílias gerais de fdps que funcionam bem em diversas 
situações experimentais, várias delas discutidas posteriormente, neste capítulo. 

Assim como no caso discreto, normalmente é útil imaginar a população de interesse constituída de X va- 
lores em vez de indivíduos ou objetos. A fdp é, então, um modelo para distribuição dos valores da população 
numérica e, pelo modelo, pode-se calcular diversas características da população (como a média). 


Exercícios I Seção 4.1 (1-10) 

1. Seja X o tempo que um livro de uma reserva de duas ho- 
ras. na biblioteca de uma faculdade, é examinado por 
um estudante selecionado aleatoriamente e suponha 
que X tenha função de densidade 

f (x) _ J 0 - 5 -* 0 < x < 2 

} \0 caso contrário 

Calcule as probabilidades a seguir: 

a. P(X< 1) 


b. P( 0,5 1,5) 

c. P( 1 ,5 < X) 


) 


2. Suponha que a temperatura de reação X (em °C), em 
um certo processo químico, tenha função de densidade 
uniforme para A = — 5 e B = 5. 

a. Calcule P(X < 0). 

b. Calcule P(-2,5 <X< 2,5). 

c. Calcule P (- 2 < X< 3). 
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d. Para k satisfazendo — 5<^<A:H-4<5, calcule 
P(k < X < k + 4). 

3. Suponha que o erro envolvido ao se fazer uma certa me- 
dida seja uma va contínua X com fdp 

= |0,09375(4 - jc 2 ) -2 < jc < 2 
IO caso contrário 

a. Faça o gráfico de /(*). 

b. Calcule P{X > 0). 

c. Calcule P(- 1 < X < 1). 

d. Calcule P(X < -0,5 ou X > 0,5). 

( 4. Seja X a tensão de vibração 1 (psi). Em uma palheta de 
turbina com certa velocidade de vento em um túnel 
aerodinâmico. O artigo “Blade Fatigue Life Assessment 
with Application to VAWTS” (J. Solar Energy Engr t 
1982, p. 107-111) propõe a distribuição de Rayleigh, 
com fdp 

í — jc > 0 

/(*;#) = N 2 

[ 0 caso contrário^ ,, 

VsAs-kt/*- ^ S ^ 

como modelo da distribuição de X. ^ 

a. Verifique se /(jc; 0) é uma fdp legítima. 

b. Suponha que 0 = 100 (valor sugerido: em um grá- 
fico do artigo). Qual é a probabilidade de X ser no 
máximo 200? Menos que 200? Pelo menos 200? 

c. Qual é a probabilidade de X estar entre 100 e 200 
(novamente assumindo 6 = 100)? 

d. Forneça uma expressão para P(X ^ x). 


e. Qual é a probabilidade de o peso real diferir do 
nominal em mais de 0,5g? 

7. Acredita-se que o tempo X (min.) para um assistente de 
laboratório preparar o equipamento para certo expe- 
rimento tenha distribuição uniforme com A = 25 e 
£ = 35. 

a. Escreva a fdp de X e faça o gráfico. 

b. Qual é a probabilidade de o tempo de preparação ex- 
ceder 33 minutos? 

c. Qual é a probabilidade de o tempo de preparação es- 
tar dentro de 2 minutos em relação à média? [Su- 
gestão: leia /i, no gráfico de /(*).] 

d. Para qualquer a tal que 25<a<tf + 2<35, qual 
é a probabilidade de o tempo de preparação estar en- 
tre a e a + 2 min.? 

8. Para ir trabalhar, primeiro preciso tomar um ônibus 
perto da minha casa e depois mudar de ônibus. Se o 
tempo de espera (em minutos) em cada parada tem uma 

v y distribuição uniforme com A = 0 e B = 5, pode ser 

mostrado que meu tempo total de espera Y tem a fdp 

7 

— y 0 ^ y < 5 
25 y y 

-L y 5 — y — io 

5 25 y 

0 y < 0 ou y > 10 


a. Desenhe o gráfico da fdp de Y. 

b. Demonstre que j f(y) dy = 1 . 


5. Um professor de faculdade nunca finaliza sua aula antes 
do final do horário e sempre termina dentro de dois 
minutos após o horário. Seja X = tempo entre o fim do 
horário e o fim da aula e suponha que a fdp de X seja 


f(x) = Ikx 2 0<*<2 
' ' 1 0 caso contrário 

a. Determine o valor de k. [Sugestão: a área total 
abaixo do gráfico de f(x) é 1]. 

b. Qual é a probabilidade de a aula terminar dentro de 
1 min. do final do horário? 

c. Qual é a probabilidade de a aula continuar além do 
horário por 60 a 90 seg? 

d. Qual é a probabilidade de a aula continuar por pelo 
menos 90 segundos após o final do horário? 

6. O peso de tração real de um cartucho de som que está 
ajustado para rodas com 3g em um certo aparelho pode 
ser considerado uma va contínua X com fdp 


,, í*[l -(*-3) 2 ] 

/« = (o 


2Sjr<4 
caso contrário 


a. Faça o gráfico de f(x). 

b. Determine o valor de k. 

c. Qual é a probabilidade de o peso real de tração ser 
maior do que o nominal? 

d. Qual é a probabilidade de o peso real estar dentro de 
0,25g de distância em relação ao nominal? 

1 psi é a abreviatura do pounds per square inch (libras por pole- 
gada quadrada). (NT) 


c. Qual é a probabilidade de o tempo total de espera ser 
no máximo 3 min.? 

d. Qual é a probabilidade de o tempo total de espera ser 
no máximo 8 min.? 

e. Qual é a probabilidade de o tempo total de espera es- 
tar entre 3 e 8 min.? 

f. Qual é a probabilidade de o tempo total de espera ser 
menos de 2 minutos ou mais de 6 minutos? 

9. Considere novamente a fdp X = tempo de avanço for- 
necida no Exemplo 4.4. 

a. Qual é a probabilidade de o tempo de avanço ser no 
máximo 6 segundos? 

b. Mais de 6 segundos? Ao menos 6 segundos? 

c. Estar entre 5 e 6 segundos? 


0. Uma família de fdps que tem sido usada para aproxi- 
mar a distribuição de renda, tamanho da população da 
cidade e tamanho das empresas é a família de curvas de 
Pareto. A família tem dois parâmetros, k e 0, ambos > 
0 e a fdp é 

f k-0 k 


/Cr, 0) = 


JC* + I 

o 


x>6 


r < ft 


a. Faça o gráfico d tf(x; k , 6). 

b. Demonstre que a área total abaixo do gráfico é igual a 1. 

c. Se a va X tiver fdp /(jc; k , 0), para qualquer b > 6. 
fixo obtenha uma expressão para P(X ^ b). 

d. Para 0 < a < b, obtenha uma expressão para a pro- 
babilidade P(a < X ^ b). 
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4.2 


Funções de Distribuição Acumulada 
e Valores Esperados 


Muitos dos conceitos mais importantes apresentados no estudo de distribuições discretas também desempenham 
papel importante nas distribuições contínuas. Definições análogas às do Capítulo 3 envolvem a substituição da 
somatória pelo símbolo de integral. 


Função Distribuição Acumulada 

A função distribuição acumulada (fdc) F{x) de uma va discreta X fornece, para qualquer número específico jc, 
a probabilidade P(X á x). Ela é obtida somando-se fmp p(y) para todos os valores possíveis y que satisfaçam 
y^x.A fdc de uma va contínua fornece as mesmas probabilidades P(X <r)eé obtida pela integração da fdp 
/()') entre os limites -<* e x. 


DEFINIÇÃO 


A função distribuição acumulada F(x) de uma va contínua X é definida para cada 
número .v por 

F(x) = P(X < x) = Í X f(y) dy 

J — oc 

Para cada x, F(x) é a área abaixo da curva de densidade à esquerda de x. Essa propriedade 
é ilustrada na Figura 4.5, onde F(x) aumenta com ajuste à medida que x aumenta. 

. — 



Figura 4.5 Uma fdp e a fdc associada 


Exemplo 4.5 

Seja X. a espessura de uma determinada chapa de metal, com distribuição uniforme no intervalo [A, B]. A função 
de densidade é exibida na Figura 4.6. Para x < A , F(x) = 0, porque não há área sob o gráfico da função de den- 
sidade à esquerda de x. Para x ^ B , F(x) = 1, já que toda a área está acumulada à esquerda de x. Finalmente, 
para A ^ x s B, 


FM = lj(y) dy = /' dy = , 


B — A 


y=A 


x- A 
B — A 


M 

\ 

\ 

Área sombreada = F(x ) 
/ 

B-A 

B-A 

! 

• 

■ 

i í 

'■ ’ L il 

: 

• 

i 

i 


A B x 

A 

x B 


Figura 4.6 A fdp para distribuição uniforme 
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A fdc completa é 


FM =< 


0 

x — A 


B-A 

1 


x < A 
A<x<B 
x> B 


O gráfico desta fdc é exibido na Figura 4.7. 



Figura 4.7 


A fdc de distribuição uniforme 


Uso de F{x) para Calcular as Probabilidades 

A importância da fdc neste caso, assim como no de vas discretas, é que as probabilidades dos diversos interva- 
los podem ser calculadas por uma fórmula ou lidas de uma tabela de FM- 


PROPOSIÇÃO 


Seja X uma va contínua com fdp f(x) e fdc FM- Então, para qualquer número a, 

P(X>à) = 1 - F(a) 

e, para quaisquer dois números atb com a < b, 

P(a < X < b) = F(b) - F(a) 


A Figura 4.8 ilustra a segunda parte dessa proposição. A probabilidade desejada é a área sombreada abaixo 
da curva de densidade entre a e b,té igual à diferença entre as duas áreas acumuladas sombreadas. 



Exemplo 4.6 

Suponha que a fdp da grandeza X de uma carga dinâmica em uma ponte (em newtons) seja dada por 

— + — x 0<x<2 
8 8 

0 caso contrário 

Para qualquer número x entre 0 e 2, 
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Dessa forma. 


F(x) = 


0 ar < 0 



1 2<x 

Os gráficos de f(x) e F{x) são exibidos na Figura 4.9. A probabilidade de a carga estar entre 1 e 1,5 é 
P(1 1,5) = F(l,5) — F(l) 

I = [i ( 1 , 5 )+ i? <l ' 5 ) ‘]“[i <1)+ ^ <1,í 

[ =-^j = 0,297 

64 

A probabilidade de a carga exceder 1 é 

/>(*>!)= !-/>(*< 1)= 1 -F(l)= 1 -[{(O + ^O) 2 ] 



Uma vez obtida a fdc, qualquer probabilidade envolvendo X é facilmente calculada sem necessidade 

de integração. 


Obtendo f(x) a partir de F(x) 

Para X discreta, a fmp é obtida pela fdc calculando-se a diferença entre dois valores F(x). A expressão continua 
análoga de uma diferença é a derivada. O resultado a seguir é uma consequência do Teorema Fundamental 

do Cálculo. 


PROPOSIÇÃO 


Se X for uma va contínua com fdp f(x) e fdc F(x) então, para qualquer x em que a derivada 
F'(x) existir, F'(x) = f(x). 


Exemplo 4.7 (Continuação do Exemplo 4.5) 

Quando X tem distribuição uniforme, F(x) é diferenciável exceto nos pontos x = A e x = B, onde o gráfico de 
F(x) forma cantos agudos. Como F(x) = 0 para x < A e F(x) = 1 para x > B, F'(x) = 0 = f(x) para tal x. Para 
A<x<B , 
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Percentis da Distribuição Contínua 

Quando dizemos que a pontuação do teste de um indivíduo estava no 85° percentil da população, queremos dizer 
que 85% de todas as pontuações da população estavam abaixo daquela pontuação e 15% acima dela. De forma 
similar, o 40° percentil é a pontuação que excede 40% de todas as pontuações e é excedido por 60%. 


DEFINIÇÃO 


Seja p um número entre 0 e 1 . O 100p-ésimo percentil da distribuição de uma va contínua 
X, representada por rj(p) é definido por 

P = F(rj(p)) = J^VOO dy (4.2) 


De acordo com a Expressão (4.2), tj (p) é o valor no eixo das medidas tal que 100/?% da área abaixo do grá- 
fico de f(.x) está à esquerda de rj(p) e 100( 1 — /?)% está à direita. Portanto, rj(0,75), o 75° percentil, é tal que a 
área abaixo do gráfico de f(x) à esquerda de tj(0,75) é 0,75. A Figura 4.10 ilustra a definição. 



Exemplo 4.8 

A distribuição da quantidade de cascalho (em toneladas) vendida por uma empresa de materiais de construção 
em uma semana é uma va contínua X com fdp 


/(*) = 


!<'-*■> 

o 


0 <*< 1 
caso contrário 


A fdc de vendas para qualquer x entre 0 e 1 é 


>'“0 



Os gráficos de f(x) e F(x) são exibidos na Figura 4.1 1. O (lOOp)-ésimo percentil dessa distribuição satisfaz 
a equação 


p = F{j](p)) = j [*,) - (T?( ^ 


isto é, 

(V(P)) 3 ~ 3 vip) + 2p = 0 

Para o 50° percentil, p = 0,5 e a equação a ser resolvida é if — 3rj + 1 = 0; a solução é rj = tj(0,5) = 
0,347. Se a distribuição continuar igual de semana para semana, no longo prazo, 50% de todas as semanas re- 
sultarão em vendas de menos de 0,347 toneladas e 50% em mais de 0,347 toneladas. 
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f(x) 

2 



0 1 


x 



Figura 4.11 A fdp e a fdc do Exemplo 4.8 


x 


DEFINIÇÃO 


A mediana de uma distribuição contínua, representada por fi, é o 50° percentil, de forma 
que/i satisfaz 0,5 = F(/I). Isto é, metade da área abaixo da curva de densidade está à es- 
querda de fie metade à direita. 


Uma distribuição contínua cuja fdp é simétrica — que significa que o gráfico da fdp à esquerda de um 
ponto é uma imagem especular do gráfico à direita desse ponto — tem mediana/I igual ao ponto de simetria, já 
que metade da área abaixo da curva encontra-se em cada lado desse ponto. A Figura 4.12 fornece diversos 
exemplos. O valor do erro na medida de uma quantidade física é frequentemente suposto como tendo dis- 
tribuição simétrica. 


fW 


-I I L. 

A pL B 



Figura 4.12 Medianas de distribuições simétricas 




Valores Esperados de Variáveis Aleatórias Contínuas 

Para uma variável aleatória discreta X, E{X) foi obtido pela soma de x • p(x) para os valores possíveis de X. Neste 
caso, substituímos a soma pela integração e a fmp pela fdp para obtermos uma média contínua ponderada. 


DEFINIÇÃO 


O valor médio ou esperado de uma va contínua X com fdp f(x) é 

H X = E(X) = f^x -f(x) dx 


Exemplo 4.9 (Continuação do Exemplo 4.8) 

A fdp das vendas semanais de cascalho X era 


então 


/(*) = 


y(l - Jr 2 ) 

0 


0 <*< 1 
caso contrário 


E{X) = x •/(*) dx = f o x • (1 - x 2 ) dx 

= !/>-*•> ‘“ 4 ( 7 - 7 ) 


2 

8 
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Quando a fdp f(x) especifica um modelo para a distribuição dos valores em uma população numérica, 
então fi é a média da população, a medida de localização ou centro da população mais freqüentemen- 
te usada. 

Freqüentemente queremos calcular o valor esperado de alguma função h(X) da va X. Se imaginarmos h(X) 
como uma nova va Y, as técnicas da estatística matemática podem ser usadas para deduzir a fdp de Y, e E(Y) 
pode ser calculada a partir da definição. Felizmente, como no caso discreto, há um modo mais fácil de calcular- 
mos E[h(X)]. 


PROPOSIÇÃO 


Se X for uma va contínua com fdp f(x) e h(X) for qualquer função de X , então 

E[h(X)] = n h(X) = £ h(x) -f(x) dx 


Exemplo 4.10 

Duas espécies estão competindo em uma região pelo controle de uma quantidade limitada de um determinado 
recurso. Seja X = a proporção do recurso controlado pela espécie 1 e suponha que X tem fdp 

fl 1 

* {x \0 caso contrário 


que é uma distribuição uniforme no intervalo [0, 1]. (Em seu livro Ecological Diversity, E. C. Pielou denomina o 
caso como o modelo da “vareta quebrada” para alocação de recursos, dada a sua analogia com a quebra de uma 
vareta em um ponto escolhido aleatoriamente.) A espécie que controla a maioria dos recursos controla a quantidade 


h(X) = max(X, 1 - X) = 


1 -X 
X 


se 0 < X < -5- 
2 

se ^ < X < 1 
2 


O valor esperado controlado pela espécie que tem controle majoritário é portanto 
E[/»(X)] = J max(jt, 1 — jc) •/(*) dx = J Q max(.r, 1 — jc) • 1 dx 


Para /t(X), função linear, £[A(X)] = E(aX + b) = aE(X) + b. 


Variância da Variável Aleatória Contínua 


DEFINIÇÃO 


A variância de uma variável aleatória contínua X com fdp/(x) e média fi é 
<rl = V(X) = £ (jc - fi) 2 •/(*) dx = E[(X - /a.) 2 ] 

O desvio padrão (DP) de X é cr x = V V(X). 


Como no caso discreto, ri é o quadrado do desvio médio ou esperado em relação à média fi e fornece uma 
medida da dispersão da distribuição ou da população dos valores de x. A forma mais fácil de calcular cr 2 é usar 
novamente uma fórmula prática. 
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PROPOSIÇÃO 


V(X) = E(X 2 ) - [£(X)] 2 


Exemplo 4.11 (Continuação do Exemplo 4.9) 

Para X = venda semanal de cascalho, calculamos £(X) = f . Como 

= f'^3 


E{X 2 ) = x 2 -/(x) dx = J Q x 2 • — (1 - x 2 ) dx 



V{X) 


ri 3 i 

= j 0 ^(x 2 -x 4 )dx = - 

= i__ (3V = J9 
5 UJ 32C 


- / v 


= 0,059 


< t x = 0,244 


Quando h(X) é uma função linear e V(X) = a 2 , V[/i(X)] = V(aX + b) = a 2 • a 2 e cr aX+b = \ a | «cr. 


Exercícios I Seção 4.2 (1 1-25) 


A fdc da duração da retirada X descrita no Exercício 
lé 

0 x < 0 


F(x) = 


T 0 — * < 2 

4 

1 2 <jc 


12 . 


Use tais condições para calcular os itens a seguir 

a. P(X S 1) 

b. F(0,5 < X < 1) 

c. P(X > 0,5) 

d. A mediana da duração da retirada (L [resolva 
0,5 = £(£)] 

e. F\x) para obter a função de densidade /(x) 

f. E(X) 

g. V(X) e <r x 

h. Se o aluno que retira o livro tem uma quantia a pa- 
gar h(X) = X 2 , quando a duração da retirada é X, 
calcule a taxa esperada £[/t(X)]. 

A fdc de X (erro de medida) do Exercício 3 for 
( 


0 


x< -2 


F(x) = 


l + i( 4 "-f) - 2S * <2 


2 <jc 


a. Calcule P(X < 0). 

b. Calcule P{- 1 <X< 1). 

c. Calcule />(0,5 < X). 

d. Demonstre que f(x) está de acordo com o fornecido 
no Exercício 3, pela obtenção de F\ x). 

e. Demonstre que /i = 0. 


13. O Exemplo 4.4 apresentou o conceito de tempo de 
avanço no fluxo de tráfego e propôs uma distribuição 
particular para X = o tempo de avanço entre dois carros 


consecutivos selecionados aleatoriamente (em segun- 
dos). Suponha que, em um ambiente de tráfego dife- 
rente, a distribuição do tempo de avanço tenha a forma 


/(*) = 


Wi 

jr 

0 x<\ 


a. Determine o valor de k para o qual /( x) é uma 
fdp legítima. 

b. Obtenha a função de distribuição acumulada. 

c. Use a fdc de (b) para determinar a probabilidade de o 
tempo de avanço exceder 2 segundos e também a 
probabilidade de ele estar entre 2 e 3 segundos. 

d. Obtenha o valor médio do tempo de avanço e seu 
desvio padrão. 

e. Qual é a probabilidade de o tempo de avanço estar 
dentro de 1 desvio padrão em relação à média? 

14. O artigo “Modeling Sediment and Water Column Inte- 
ractions for Hydrophobic Pollutants” ( Water Research, 
1984, p. 1 169-1 174) sugere a distribuição uniforme no 
intervalo (7,5, 20) como modelo para a profundidade 
(cm) da camada de bioturbação em sedimentos de uma 
determinada região. 

a. Qual é a média e a variância da profundidade? 

b. Qual é a fdc da profundidade? 

c. Qual é a probabilidade de a profundidade observada 
ser no máximo 10? Entre 10 e 15? 

d. Qual é a probabilidade de a profundidade observada 
estar dentro de 1 desvio padrão em relação ao valor 
da média? E dentro de 2 desvios padrão? 

15. Seja X o espaço ocupado por um produto colocado em 
um recipiente de 1 pé cúbico. A fdp de X é 



90jc 8 (1 - jc) 0 < jc < 1 
0 caso contrário 
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a. Desenhe o gráfico da fdp. Determine então a fdc de 
X e desenhe seu gráfico. 

b. Qual é a P(X < 0,5) [isto é, F(0,5)]? 

c. Usando o item (a), qual é P( 0,25 < X ^ 0,5)? Qual 
é/>(0,25<X<0,5)? 

d. Qual é o 75° percentil da distribuição? 

e. Calcule E(X) e a x . 

f. Qual é a probabilidade de X estar a mais de 1 desvio 
padrão em relação ao valor da média? 

16. Responda aos itens (a)-(f) do Exercício 15 com X = 
tempo de palestra além da hora dada no Exercício 5. 

17. Considere a fdp de X = peso de tração real fornecido no 
Exercício 6. 

a. Determine e desenhe o gráfico de X. 

b. Determine /Z pelo gráfico de f(x). 

c. Calcule £(X) e V(X). 

18. Considere X tendo distribuição uniforme no intervalo 

[A, B]. 

a. Determine uma expressão para o (100/?)-ésimo 
percentil. 

b. Calcule E(X), V(X), e <r x . 

c. Calcule E(X n ) para n inteiro positivo. 

19. Seja X uma va contínua com fdc. 


F( jc) = 


0 jc<0 

[ 1+1 „(í)] 0 < , S 4 

1 x>4 


[Esse tipo de fdc é sugerido no artigo “Variability in 
Measured Bedload-Transport Rates” ( Water Resources 
Buli , 1985, p. 39-48) como modelo para determinada 
variável hidrológica]. Qual é 

a. P(X< 1)? 

b. P( 1 <X<3)? 

c. A fdp de X? 

20. Considere a fdp do tempo total de espera Y para 
dois ônibus 


/oo = 



0<y <5 


< 2 
5 


-jjjy 5<y<10 
0 caso contrário 


apresentado no Exercício 8. 

a. Calcule e desenhe a fdade Y. [ Sugestão : considere 

separadamente < 5 e 5 10 ao calcular 

F(y). Um gráfico da fdp pode ser útil]. 

b. Determine uma expressão para o (lOOp)-ésimo per- 
centil. ( Sugestão : considere separadamente 0 < p < 
0,5 e 0,5 <p< 1.) 

c. Calcule E(Y) e V(K). Como elas se comparam ao 
tempo de espera estimado e à variância de um único 


ônibus quando o tempo tem distribuição uniforme no 
intervalo [0, 5]? 

21. Um ecologista deseja marcar uma região de amostragem 
circular com raio de 1 0 m. Entretanto, o raio da região re- 
sultante é, na verdade, uma variável aleatória R com fdp 

,, , J^tl - (10 - r) 2 ] 9<r<ll 
f(r) = 4 

0 caso contrário 


Qual é a área esperada da região circular resultante? 

22. A demanda semanal de gás propano (em milhares de 
galões) de uma instalação é uma va X com fdp 



1 <jc<2 
caso contrário 


a. Calcule a fdc de X. 

b. Determine uma expressão para o (lOOp)-ésimo per- 
centil. Qual é o valor de /z? 

c. Calcule E(X) e V(X). 

d. Se 1,5 mil galões estão em estoque no começo da se- 
mana e nenhuma entrega está programada para a 
semana, quanto desse volume se espera ter no fim da 
semana? Sugestão: seja h(x) = quantidade restante 
quando a demanda = x. 

23. Se a temperatura de fusão de certo componente for uma 
variável aleatória com valor médio 120 °C e desvio 
padrão 2 °C. quais são a temperatura média e o des- 
vio padrão em °F? ( Sugestão : °F = 1,8 °C 4- 32.) 

24. Seja X com fdp de Pareto 


k-0 k 


/(*; K 0) = 



x>e 

x<e 


apresentado no Exercício 10. 

a. Se k > 1, calcule £(X). 

b. O que se pode dizer sobre E(X) se k = 1? 

c. Se k > 2, mostre que V(X) = kd 2 (k - 1 )~ 2 (k - 2) '. 

d. Se k = 2, o que pode ser dito sobre V(X)? 

e. Que condições em k são necessárias para assegurar 
que E(X n ) seja finita? 

25. Seja X a temperatura em °C em que ocorre uma rea- 
ção química e seja Y a temperatura em °F (então 

Y= 1,8X4- 32). 

a. Se a mediana da distribuição X é /i, demonstre que 
1,8/2 4- 32 é a mediana da distribuição Y. 

b. Como o 90° percentil da distribuição Y se relaciona 
com o 90° percentil da distribuição X? Demonstre 
suas conjecturas. 

c. De maneira geral, se Y = aX + b, como qualquer 
percentil da distribuição Y se relaciona com o per- 
centil correspondente da distribuição X? 
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4.3 


A Distribuição Normal 


A distribuição normal é a mais importante de todas em probabilidade e estatística. Muitas populações numéri- 
cas possuem distribuições que podem ser ajustadas aproximadamente por uma curva normal apropriada. Os 
exemplos incluem alturas, pesos e outras características físicas (o famoso artigo da Biometrika, de 1903 “On the 
Laws of Inheritance in Man”, discutiu muitos exemplos desse tipo), erros de medida em experimentos científi- 
cos. medidas antropométricas em fósseis, tempos de reação em experimentos psicológicos, medidas de inte- 
ligência e aptidão, pontuações em testes variados e numerosas medidas e indicadores econômicos. Mesmo 
quando a distribuição em questão é discreta, a curva normal freqüentemente fornece aproximação excelente. 
Além disso, ainda que as próprias variáveis individuais não sejam normalmente distribuídas, as somas e as mé- 
dias das variáveis terão uma distribuição aproximadamente normal sob condições adequadas. Essa é a essência 
do Teorema do Limite Central discutido no próximo Capítulo. 


DEFINIÇÃO 


Diz-se que uma va contínua X possui uma distribuição normal com parâmetros fie cr (ou 
fi e cr 2 ), onde -<»</x<!»e0<cr, se a fdp de X for 

f(x\ fi, &) = — À — g-cx-nfia**) -oo < x < <» (4.3) 

V27rcr 


Novamente, e denota a base do sistema de logaritmos naturais e é aproximadamente igual a 2,71828 e tt 
representa a constante matemática familiar com valor aproximado 3,14159. A afirmação de que X possui dis- 
tribuição normal com parâmetros /tt e cr 2 é normalmente abreviada por X ~ N(/x, cr 2 ). 

Claramente f(x\ fi, cr) 2: 0 para qualquer número x, mas as técnicas do cálculo de multivariados são 
usadas para demonstrar que }" r f(x\ fi, cr) dx = 1. Demonstra-se que E(X) =/tt e V(X) = cr 2 , de forma que os 
parâmetros são a média e o desvio padrão de X. A Figura 4. 1 3 apresenta gráficos de /(.t; fx, cr) para diversos pares 
(g, cr). Cada gráfico é simétrico em tomo de /x e tem forma de sino, de modo que o centro do sino (ponto de 
simetria) é tanto a média como a mediana da distribuição. O valor de cr é a distância de fi até os pontos de in- 
flexão da curva (os pontos em que a curva muda de direção). Valores grandes de cr geram gráficos com grande 
dispersão em tomo de /t, enquanto valores pequenos de cr fornecem gráficos com picos altos acima de /tt e a 
maior parte da área do gráfico é muito próxima de /tt. Assim, cr grande implica boa possibilidade de se observar 
um valor de X afastado de /tt, enquanto essa possibilidade é muito improvável para a pequeno. 



Figura 4.13 Gráficos de fdps normais 


Distribuição Normal Padrão 

Para calcular P(a <Xs6) quando X é uma va normal com parâmetros fx e cr, devemos calcular 

[ f-vhz ^ (44) 

Nenhuma das técnicas de integração-padrão podem ser usadas para calcular a Expressão (4.4). Em vez 
disso, quando /tt = 0 e cr = 1, á Expressão (4.4) foi calculada numericamente e tabulada para valores determi- 
nados de a e b. Essa tabela também é usada para calcular probabilidades de quaisquer outros valores de /tt e cr 
que estejam em consideração. 
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DEFINIÇÃO 


A distribuição normal com parâmetros /i. = Oetr = 1 é denominada distribuição normal 
padrão. Uma variável aleatória que tenha distribuição normal padrão é denominada va- 
riável aleatória normal padrão e é denotada por Z. A fdp de Z é 

fiz; 0 , 1 ) = ^ 7 = e- en -oo<z<* 

A fdc de Z é P(Z < z) = [Lf(y; 0, 1), que será denotada por <t>(z). 


A distribuição normal padrão freqüentemente não serve como modelo para uma população natural. Ao 
contrário, é uma distribuição de referência a partir da qual podem ser obtidas informações sobre outras dis- 
tribuições normais. A Tabela A. 3 do Apêndice fornece 4>(z) = P(Z ^ z), a área abaixo do gráfico da fdp 
normal padrão à esquerda de z, para z = —3,49, —3,48, . . . , 3,48, 3,49. A Figura 4.14 ilustra o tipo de área 
acumulada (probabilidade) tabulada na Tabela A. 3. Pela tabela podem ser calculadas diversas outras pro- 
babilidades que envolvem Z. 


Área sombreada = <t>(z) 

„ Curva normal padrão (z) 



Figura 4.14 Áreas normais padrão acumuladas tabuladas na Tabela A. 3 do Apêndice 


Exemplo 4.12 

Calcule as seguinte probabilidades normais padrão: (a) P(Z ^ 1,25), (b) P(Z > 1,25), (c) P(Z < —1,25) e (d) 
P(-0,38<Z< 1,25). 

a. P(Z^ 1,25) = d>(l,25), probabilidade tabulada na Tabela A.3 do Apêndice na interseção da linha 
1,2 com a coluna 0.05. O número mostrado é 0,8944, então P(Z ^ 1,25) = 0,8944. Consulte a Fi- 
gura 4.15(a). 




Figura 4.15 Áreas da curva normal (probabilidades) do Exemplo 4.12 

b. P(Z > 1,25) = 1 - P(Z < 1,25) = 1 - d>(l,25), a área abaixo da curva normal padrão à direita de 1,25 
(área sob a cauda superior). Como d>(l,25) = 0,8944, então P(Z > 1,25) = 0,1056. Como Z é uma va 
contínua, P(Z ^ 1,25) também é igual a 0,1056. Consulte a Figura 4.15 (b). 

c. P(Z£ —1,25) = 4>( — 1,25), a área sob a cauda inferior. Diretamente da Tabela A.3 do Apêndice, 
<t>(- 1,25) = 0,1056. Por simetria da curva normal, esta é a mesma resposta do item (b). 

d. P(— 0,38 í Zs 1,25) é a área abaixo da curva normal padrão acima do intervalo cujo ponto extremo 
esquerdo é -0,38 e o direito é 1,25. Da Seção 4.2, seXé uma va contínua com fdc F(x), então P(a < X< 
b) = F(b) - F(a). O que fornece P(- 0,38 £ Z^ 1,25) = <t»( 1 ,25) — 4>(-0, 38) = 0,8944 - 0,3520 = 
0,5424. (Consulte a Figura 4.16.) 


Variáveis Aleatórias Contínuas e Distribuições de Probabilidade - Jay L. Devore 143 



Figura 4.16 P{-0,38 1,25) como a diferença entre duas áreas acumuladas ■ 


Percentis da Distribuição Normal Padrão 

Para qualquer p entre 0 e 1 , a Tabela A. 3 do Apêndice é usada para obter o (lOQp)-ésimo percentil da distribuição 

normal padrão. 

Exemplo 4.13 

0 99° percentil da distribuição normal padrão é o valor no eixo horizontal tal que a área sob a curva 
à esquerda do valor seja 0,9900. A Tabela A.3 do Apêndice fornece para z fixo a área abaixo da curva normal 
à esquerda de z, neste caso temos a área e queremos o valor de z. Este é o problema “inverso” de P(Z < z) = ? 
de modo que a tabela é usada de maneira inversa: encontre na tabela o valor 0,9900; a linha e a coluna onde se 
acha o valor identificam o 99 a percentil de z. No caso, 0,9901 está na linha 2,3 e coluna 0,03, então o 99 a per- 
centil é (aproximadamente) z = 2,33. (Veja a Figura 4.17.) Por simetria, o primeiro percentil é o negativo do 
99"' percentil, então é igual a —2,33 (1% fica abaixo do primeiro e acima do 99 a ). (Veja a Figura 4. 18.) 



Figura 4.17 Determinação do 99 g percentil 



Figura 4.18 Relação entre oleo 99* percentis 


Em geral, o ( 100p)ésimo percentil é identificado pela linha e coluna da Tabela A.3 do Apêndice onde se en- 
contra a entrada p (por exemplo: o 67 c percentil é obtido encontrando-se 0,6700 no corpo da tabela, que fornece 
Z - 0,44). Se p não estiver na tabela, normalmente é usado o número mais próximo a ele, apesar de que a inter- 
polação linear tomece uma resposta mais precisa. Por exemplo: para determinar o 95 c percentil, procuramos 
0,9500 na tabela. Apesar de 0,9500 não aparecer, os valores 0,9495 e 0,9505 são mostrados e correspondem a 
l - 1,64 e 1,65, respectivamente. Como 0,9500 está na metade da diferença entre as duas probabilidades 
mostradas, usaremos 1,645 como o 95 c percentil e - 1,645 como o 5 fl percentil. 
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Notação z a 

Em inferência estatística, precisaremos dos valores do eixo das medidas que encerram pequenas áreas da cauda 
abaixo da curva normal padrão. 

Notação z a 

Za representará o valor no eixo das medidas para o qual uma área abaixo da curva z fica à direita de Za- 
(Veja a Figura 4.19.) 


Por exemplo: Zo .,o contém a área sob a cauda superior 0,10 e Zo.oi contém a área sob a cauda superior 0,01. 



Como a da área abaixo da curva normal padrão está à direita de Za, 1 — a da área está à esquerda de 
Portanto, Za é o 100(1 — a)-ésimo percentil da distribuição normal padrão. Por simetria, a área abaixo da curva 
normal e à esquerda de -Za também é a. Os z,,s normalmente são denominados valores críticos de z. A Tabela 
4. 1 relaciona os percentis normais padrão mais usados e os valores Za- 



Tabela 4.1 Percentis normais padrão e valores críticos 


Percentil 

90 

95 

97,5 

99 

99,5 

99,9 

99,95 

a (área sob a cauda) 

0,1 

0,05 

0.025 

0,01 

0,005 

0.001 

0.0005 

Za = 100(1 - a)-ésimo percentil 

1,28 

1.645 

1,96 

2,33 

2,58 

3.08 

3,27 


Exemplo 4.14 

Zo.o 5 é o 100(1 — 0,05)ésimo = 95° percentil da distribuição normal padrão, de modo que Zo , 0 5 = 1,645. A área 
abaixo da curva normal padrão à esquerda de -Zo.os também é 0,05. (Veja a Figura 4.20). 


Curva z 



- 1,645 = -Zo.os Zo.os = 95° percentil = 1,645 

Figura 4.20 Determinação de Ct5 


■ 


Distribuições Normais Não-Padrão 

Quando X ~ N(/x, cr 2 ), as probabilidades que envolvem X são calculadas por “padronização”. A variável 
padrão é (X - \x)!cr. A subtração de /x desloca a média de fx para zero e depois a divisão por a escalona a va- 
riável, de forma que o desvio padrão passa a ser 1 em vez de a. 
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PROPOSIÇÃO Se X tem distribuição normal com média \x e desvio padrão o*, então 



<T 

tem distribuição normal padrão. Assim, 


P(a<X<b) = s Z < b a fX ] j 


-Irfl-lr?) 


P(X < a) = P(X 2= b) = 1 - 


A idéia-chave da proposição é que, pela padronização, qualquer probabilidade que envolva X é expressa 
como uma probabilidade que envolve uma va normal padrão Z, de forma que a Tabela A.3 do Apêndice pode ser 


0 tempo que um motorista leva para reagir às luzes de freio em um veículo em desaceleração é crucial para evi- 
tar colisões traseiras. O artigo “Fast-Rise Brake Lamp as a Collision-Prevention Device” ( Ergonomics , 1993, p. 
391-395) sugere que o tempo de reação de uma resposta no trânsito a um sinal de frenagem com luzes de freio 
convencionais pode ser modelado com uma distribuição normal de média 1,25 segundo e desvio padrão 0,46 se- 
gundo. Qual é a probabilidade de que o tempo de reação esteja entre 1,00 e 1,75 segundo? Se representarmos 
por X o tempo de reação, a padronização fornece 


usada. A figura 4.21 ilustra o caso. A proposição é demonstrada escrevendo a fdc de Z = (X — fJ.)/cr como 


P{Z Sj) = P(X < az + m) = /(*; P-, cr) dx 



Usando um resultado do cálculo, integral pode ser diferenciada em relação à z para fornecer a fdp desejada 


N(u. ÍT 2 ) 


m. D 



(x -fiVcr 


Figura 4.21 Igualdade das áreas de curvas normais não-padrào e padrão 


Exemplo 4.15 


1,00 1,75 


se, e somente se. 


1,00 ~ 1,25 < X - 1,25 < 1,75 - 1,25 
0,46 “ 0,46 “ 0,46 


Dessa forma, 



= P(-0,54 < Z < 1.09) = 4>(1,09) - 4>(-0,54) 
= 0,8621 - 0,2946 = 0,5675 
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Normal, — 1 •>« — « *» ' "" v «r i t«\ 



Curva z 


1.25 


0 


1,00 1,75 


-0,54 1,09 


Figura 4.12 Curvas normais do Exemplo 4. 1 5 


A Figura 4.22 ilustra o problema. De forma similar, se considerarmos que 2 segundos é um tempo de 
resposta muito longo, a probabilidade de que o tempo real de resposta exceda esse valor será 


cia novamente como certo número de desvios padrão. Por exemplo: se p. = 100 e cr = 15, então x = 130 corres- 
ponde a z = (130 — 100)/15 = 30/15 = 2,00. Isto é, 130 está a 2 desvios padrão acima (à direita) do valor da 
média. De forma similar, padronizar 85 fornece (85 — 100)/15 = —1,00, de forma que 85 está 1 desvio padrão 


voltagem estar a 1 desvio padrão de seu valor médio? Esta pergunta pode ser respondida sem conhecer p ou cr, 


A probabilidade de X estar no intervalo de 2 desvios-padrão é P(-2,00 SZS 2,00) = 0,9544 e no inter- 


dem ser aproximados por curvas normais). 


Se a distribuição de população de uma variável for (aproximadamente) normal, então 

1. Cerca de 68% dos valores estão a 1 DP da média. 

2 . Cerca de 95% dos valores estão a 2 DPs da média. 

3 . Cerca de 99,7% dos valores estão a 3 DPs da média. 


É incomum observar um valor de uma população normal muito mais distante de 2 desvios padrão de /x. 
Esses resultados serão importantes no desenvolvimento dos procedimentos de teste de hipóteses nos capí- 
tulos posteriores. 


P(X > 2) = p(z > 2 n *’ 25 ) = P(Z > 1,63) = 1 - $(1,63) = 0,0516 


0,46 ) 


A padronização nada mais é que calcular uma distância em relação à média e então expressar essa distân- 


abaixo da média. A tabela z se aplica a qualquer distribuição normal, desde que pensemos em termos de número 
de desvios padrão em relação à média. 


Exemplo 4.16 

A voltagem de quebra de um diodo de um tipo específico tem distribuição normal. Qual é a probabilidade dessa 


desde que a distribuição seja normal. Em outras palavras, a resposta é a mesma para qualquer distribuição normal: 
P(X está no intervalo de 1 desvio padrão da média) = P(p — cr^X^p + o-) 



= P(-1,00<Z< 1,00) 

= $(1,00) - $(-1,00) = 0,6826 


valo de 3 desvios padrão é P(-3,00 SZS 3,00) = 0,9974. 


Os resultados do Exemplo 4.16 são freqíientemente relatados sob a forma de porcentagem e são denomi- 
nados regra empírica (porque evidências empíricas mostram que histogramas de dados reais freqíientemente po- 
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Percentis de uma Distribuição Normal Arbitrária 

0 (lOOp)-ésimo percentil de uma distribuição normal com média /x e desvio padrão cr pode ser facilmente rela- 
cionado com o (lOOp)-ésimo percentil da distribuição normal padrão. 


PROPOSIÇÃO 


(lOOp)-ésimo percentil 
para a normal (/x, a) 


= /x + 


[ (lOOp)-ésimo para a 
normal padronizada 


cr 


Outra forma de expressar a proposição: se z é o percentil desejado da distribuição normal padrão, então o 
percentil desejado da distribuição normal (/x, cr) está a z desvios padrão de /x. 

Exemplo 4.17 

A quantidade de água destilada produzida por certa máquina tem distribuição normal com valor médio de 64 
onças e desvio padrão de 0,78 onça. Qual o tamanho de recipiente c que assegurará que ocorra transbordamento 
em apenas 0,5% das vezes? Se X representa a quantidade usada, a condição desejada é que P(X > c) = 0,005, 
ou, de forma equivalente, que P(X ^ c) = 0,995. Assim, c é o 99,5 a percentil da distribuição normal com /x = 
64 e <7 = 0,78. O 99,5 a percentil da distribuição normal padrão é 2,58, então 

c = tj( 0,995) = 64 + (2,58)(0,78) = 64 + 2,0 = 66 onças 

A questão está ilustrada na Figura 4.23. 



c = 99,5° percentil = 66,0 

Figura 4.23 Distribuição da quantidade produzida do Exemplo 4.17 ■ 


A Distribuição Normal e as Populações Discretas 

A distribuição normal é usada com freqüência como aproximação para a distribuição de valores de uma popu- 
lação discreta. Em tais situações, devemos tomar cuidado redobrado para nos assegurarmos de que as probabi- 
lidades sejam calculadas de forma precisa. 

Exemplo 4.18 

OQI em uma determinada população (medido pelo teste-padrão) é sabido ter distribuição aproximadamente nor- 
ma) com /x = 100 e a = 15. Qual é a probabilidade de um indivíduo selecionado aleatoriamente ter um QI de 
pelo menos 125? Sendo X = Q1 de uma pessoa selecionada aleatoriamente, queremos saber P(X > 125). A ten- 
tação aqui é padronizar X ^ 1 25 imediatamente, como foi feito nos exemplos anteriores. O problema, entretanto, 
é que a população de QI é discreta, visto que os Qi’s são valores inteiros, de forma que a curva normal é a apro- 
ximação de um histograma de probabilidade discreta, conforme ilustrado na Figura 4.24. 

Os retângulos do histograma estão centrados em inteiros, de forma que o QI de pelo menos 125 corres- 
ponde aos retângulos começando em 124,5, conforme sombreado na Figura 4.24. Assim, queremos a área abaixo 
da curva normal de aproximação à direita de 124,5. A padronização desse esse valor fornece PfZâ 1,63) = 
0,0516. Se tivéssemos padronizado X & 125, teríamos obtido P(Z s 1,67) = 0, 0475. A diferença não é grande, 
mas a resposta 0,0516 é mais precisa. De forma similar, P(X = 125) seria aproximada pela área entre 124,5 e 
125,5, já que a área abaixo da curva normal acima do valor 1 25 é zero. 
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125 

Figura 4.24 Aproximação normal de uma distribuição discreta ■ 

A correção da descontinuidade da distribuição subjacente no Exemplo 4.18 é freqüentemente denominada 
correção de continuidade. Ela é útil na seguinte aplicação da distribuição normal, para cálculo de probabili- 
dades da binomial. 


Aproximação Normal 
para a Distribuição Binomial 

Lembre-se de que o valor médio e o desvio padrão de uma variável aleatória X são p. x = np e o* = Xnpq. res- 
pectivamente. A Figura 4.25 exibe um histograma de prob abilidade bino mial para a distribuição binomial com 
n = 20, p = 0,6 [de forma que p = 20(0,6) = 12 e ar = V20( 0,6) (0,04) = 2,19]. Uma curva normal com valor 
médio e desvio padrão iguais aos valores correspondentes para a distribuição binomial foi sobreposta no his- 
tograma de probabilidade. Apesar de o histograma ter um pouco de inclinação (porque p i 1 0,5), a curva normal 
fornece uma aproximação muito boa, especialmente na parte central da figura. A área de qualquer retângulo 
(probabilidade de qualquer valor X particular), exceto aqueles nas extremidades das caudas, pode ser aproximada 
com precisão pela área correspondente da curva normal. Por exemplo: P(X = 10) = B( 10; 20, 0,6) — B( 9; 20, 
0,6) = 0,1 17, enquanto a área sob a curva normal entre 9,5 e 10,5 é P( — 1,14 ^ Z ^ —0,68) = 0,1212. 



Figure 4.25 Histograma de probabilidade binomial para n = 20, p = 0,6 com curva de aproximação normal sobreposta J 

De forma mais geral, contanto que o histograma de probabilidade não apresente muita inclinação, as pro- 
babilidades binomiais podem ser bem aproximadas pelas áreas da curva normal. Habitualmente se diz que X tem 
uma distribuição aproximadamente normal. 


PROPOSIÇÃO 


Seja X uma va binomial com base em n tentativas com probabilidade de sucesso p. Então, 
se o histograma de probabilidade binomial não tiver mui ta in clinação, X terá uma dis- 
tribuição aproximadamente normal com p. — np e cr = \fnpq. Em particular, para x = 
valor possível de X, 


P(X < x) = B(x; n. 


í área abaixo da curva normal 
\à esquerda de x + 0,5 


= 4>l 


/x + 0,5— np\ 

l ^npq ) 


Na prática, a aproximação é adequada desde que np ^ 10 e nq ^ 10. 
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Se np < 10 ou nq < 10. a distribuição terá muita inclinação para que a curva normal (simétrica) forneça 
uma aproximação precisa. 


Exemplo 4.19 

Suponha que 25% de todos os motoristas habilitados de um determinado estado não tenham seguro. Represente 
por X o número de motoristas sem seguro em uma amostra aleatória de tamanho 50 (com um quê de perversi- 
dade, o sucesso é o motorista não ter seguro), de forma que p = 0, 25. Então p = 12,5 e cr = 3,06. Como np = 
50(0,25) = 12,5 s 10 e nq = 37,5 2: 10, a aproximação pode ser aplicada com segurança: 


P(X< 10) = fí(10; 50, 0,25) = 


4>l 


10 + 0,5 -12,5 
3.06 


= <J>(— 0,65) = 0,2578 


De forma similar, a probabilidade de inclusive entre 5 e 15 motoristas selecionados não terem seguro é 


P(5 < X < 15) = B( 15; 50, 0,25) - B( 4; 50. 0,25) 



0,8320 


As probabilidades exatas são 0,2622 e 0.8348, respectivamente, de forma que as aproximações são muito 
boas. No último cálculo, a probabilidade P( 5 ^ X < 15) é aproximada pela área sob a curva normal entre 4,5 e 
15,5. A correção de continuidade é usada para os limites superior e inferior. ■ 

Quando o objetivo da investigação é fazer uma inferência sobre a proporção p de uma população, o inte- 
resse enfocará a proporção amostrai de sucessos X/n em vez de X. Como essa proporção é X multiplicada pela 
co nstan te l/n, também terá uma distribuição aproximadamente normal (com média p = p e desvio padrão a = 
Vpq/n) desde que np 2 10 e nq 2 10. Essa aproximação normal é a base de diversos procedimentos inferenciais 
a serem discutidos nos capítulos posteriores. 

É muito difícil dar uma prova direta da validade da aproximação normal (a primeira é de Laplace, há mais 
de 150 anos). No próximo capítulo, veremos que ela é uma conseqüência de um importante resultado geral de- 
nominado Teorema do Limite Central. 


Exercícios | Seção 4.3 (26-54) 

26. Seja Z uma variável aleatória normal e calcule as 
probabilidades a seguir, fazendo as ilustrações quan- 
do apropriado. 

a. P(0sZ<2,17) 

b. P(0 < Z < 1) 

c. P(- 2,50 < Z < 0) 

d. P{- 2,50 <Z< 2,50) 

e. P(Z< 1,37) 

f. P(-1,75<Z) 

g. PH, 50 < Z < 2,00) 

h. P(1,37<Z<2,50) 

i. P(1,50SZ) 

j. P(|z| < 2 , 50 ) 

27. Em cada caso, determine o valor da constante c que 
toma correta a declaração de probabilidade. 

a. 4>(c) = 0,9838 

b. P(0<Z<c) = 0,291 


c. P(c < Z) = 0,121 

d. P(-c <Z<c) = 0,668 

e. P(c < | Z | ) = 0,016 

28. Encontre os percentis a seguir para a distribuição nor- 
mal. Faça a interpolação quando apropriado. 

a. 91 a 

b. 9 a 

c. 75 a 

d. 25 a 

e. 6 a 

29. Determine Za para os itens a seguir: 

a. a = 0,0055 

b. a = 0,09 

c. a = 0,663 

30. Se X é uma va normal com média 80 e desvio padrão 10, 
calcule as probabilidades a seguir, usando padronização: 
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a. P(X< 100) 

b. P(X < 80) 

c. P(65 <X< 100) 

d. PO0 s X ) 

e. P( 85 s X < 95) 

f. P(|X- 80 1 < 10) 

31. Suponha que a força que age sobre uma coluna que 
ajuda a suportar um edifício tenha distribuição normal 
com média 15,0 kips e desvio padrão 1,25 kips. Qual é 
a probabilidade de a força: 

a. Ser no máximo 18 kips? 

b. Estar entre 10 e 12 kips? 

c. Diferir de 15,0 kips por no máximo 2 desvios 
padrão? 

32. O artigo “Reliability of Domestic-Waste Biofilm Reac- 
tors” (, J . ofEmir Engr. f 1995, p. 785-790) sugere que a 
concentração de substrato (mg/cm3) de influência para 
um reator tem distribuição normal com /x = 0,30 e 
<7 = 0,06. 

a. Qual é a probabilidade de a concentração exceder 0,25? 

b. Qual é a probabilidade de a concentração ser no 
máximo 0,10? 

c. Como você caracterizaria os maiores 5% de todos os 
valores de concentração? 

33. Suponha que o diâmetro de certo tipo de árvores na al- 
tura do tronco tenha distribuição normal com /i = 8,8 e 
cr = 2,8, conforme sugerido pelo artigo “Simulating a 
Harvester-Forwarder Softwood Thinning” ( Forest Pro- 
ducts May 1997, p. 36-41). 

a. Qual é a probabilidade de uma árvore selecionada 
aleatoriamente ter um diâmetro de no mínimo 10 
polegadas? Exceder 10 polegadas? 

b. Qual é a probabilidade de o diâmetro de uma árvore 
selecionada aleatoriamente exceder 20 polegadas? 

c. Qual é a probabilidade de o diâmetro de uma ár- 
vore selecionada aleatoriamente estar entre 5 e 10 
polegadas? 

d. Que valor c faz com que o intervalo (8,8 — c, 8,8 + c) 
inclua 98% de todos os valores de diâmetro? 

e. Se quatro árvores forem selecionadas de forma inde- 
pendente, qual é a probabilidade de ao menos uma 
ter diâmetro maior que 10 polegadas? 

34. Há duas máquinas disponíveis para corte de rolhas para 
garrafas de vinho. A primeira produz rolhas com 
diâmetros que possuem uma distribuição normal com 
média 3 cm e desvio padrão 0,1 cm. A segunda máqui- 
na produz rolhas com diâmetros que possuem uma dis- 
tribuição normal com média 3,04 cm e desvio padrão 
0,02 cm. As rolhas aceitáveis possuem diâmetros entre 
2,9 cm e 3,1 cm. Que máquina tem maior probabilidade 
de produzir uma rolha aceitável? 

35. a. Se uma distribuição normal tem /x = 30 e a = 5, 

qual é o 91 2 percentil da distribuição? 

b. Qual é o 6 a percentil da distribuição? 

c. A largura de uma linha gravada em um chipe de cir- 
cuito integrado tem distribuição normal com média 

♦3^ **4 li ) . pr lázJty* 


3,000 /xm e desvio-padrão 0,140. Que valor sepa- 
ra os 10% mais largos de todas as linhas dos ou- 
tros 90% ? 

36. O artigo “Monte Cario Simulation-Tool for Better Un- 
derstanding of LRFD” (7. Structural Engr , 1993, p. 
1586-1599) sugere que a resistência de rendimento 
(ksi) de aço de graduação A36 tem distribuição normal 
com /x = 43 e cr = 4,5. 

a. Qual é a probabilidade de a resistência ser no má- 
ximo 40? Maior que 60? 

b. Que valor de resistência separa os 75% mais fortes 
dos outros? 

/ 

37. O dispositivo de abertura automática de um pára- 
quedas de carga militar foi projetado para abrir quando 
estiver a 200 m do solo. Suponha que a altitude de aber- 
tura tenha uma distribuição normal com média 200 m e 
desvio padrão 30 m. Haverá dano no equipamento se 
o pára-quedas abrir a uma altitude inferior a 100 m. 
Qual é a probabilidade de haver dano ao equipamen- 
to em pelo menos um de cinco pára-quedas lançados 
independentemente? 

38. A leitura de temperatura de um par termoelétrico colo- 
cado em um meio de temperatura constante tem dis- 
tribuição normal com média /x e desvio-padrão cr. Que 
valor <j precisaria existir para assegurar que 95% de to- 
das as leituras estão dentro de 0,1° de /x? 

39. A distribuição da resistência de resistores de um tipo 
específico é normal, 10% de todos os equipamentos 
apresentam resistência maior que 10,256 ohms e 5% 
com resistência menor que 9,671 ohms. Quais são os 
valores da média e do desvio padrão da distribuição 
das resistências? 

40. Se o comprimento da rosca de um parafuso tem distri- 
buição normal, qual é a probabilidade de o comprimento 
da rosca de um parafuso selecionado aleatoriamente: 

a. estar a 1 ,5 DPs do valor da média? 

b. estar a mais de 2,5 DPs do valor da média? 

c. estar entre 1 e 2 DPs do valor da média? 

41. Uma máquina que produz rolamentos inicialmente foi 
configurada para que o diâmetro real médio dos rola- 
mentos produzidos seja de 0,500 polegadas. Um rola- 
mento é aceitável se o diâmetro está dentro de 0,004 
polegadas desse valor-alvo. Suponha, entretanto, que a 
configuração tenha sido alterada durante o curso da pro- 
dução, de forma que os rolamentos tenham diâmetros 
com distribuição normal com média 0,499pol e desvio 
padrão 0,002 polegadas. Que porcentagem dos rola- 
mentos produzidos não será aceitável? 

42. A dureza Rockwell de um metal é determinada pela 
pressão de uma ponta rígida na superfície do metal e, 
em seguida, pela medição da profundidade de pene- 
tração das pontas. Suponha que a dureza Rockwell de 
uma determinada liga tenha distribuição normal com 
média 70 e desvio padrão 3. (A dureza Rockwell é me- 
dida em uma escala contínua.) 

f(- f C i " P L* ~%i 


Variáveis Aleatórias Contínuas e Distribuições de Probabilidade - Jay L. Devore 151 


a. Se uma amostra for aceitável apenas se a sua dure- 
za estiver entre 67 e 75, qual é a probabilidade de 
uma amostra selecionadoa aleatoriamente ter dure- 
za aceitável? 

b. Se o intervalo aceitável de dureza for (70 - c, 70 + 
c), para que valor de c 95% de todos das amostras 
teriam uma dureza aceitável? 

c* Se o intervalo aceitável for o da parte (a) e a dureza 
de cada uma de 10 amostras selecionadas aleatoria- 
mente for determinada de forma independente, qual 
será o número esperado de amostras aceitáveis den- 
tre os 10? 

d. Qual é a probabilidade de no máximo oito de 10 
amostras selecionadas de forma independente terem 
dureza inferior a 73,84? ( Sugestão : Y = número en- 
tre as 10 amostras com dureza inferior a 73,84 é uma 
variável binomial. Qual é p?) 

43. A distribuição do peso de pacotes enviados de uma de- 
terminada forma é normal com média 12 libras e desvio 
padrão 3,5 libras. O serviço de encomendas deseja de- 
terminar um valor c acima do qual haverá um 
acréscimo. Que valor de c faz com que 99% de todos os 
pacotes estejam no mínimo 1 libra abaixo do peso 
de acréscimo? 

44. Suponha que a Tabela A.3 do Apêndice contenha 
apenas para z ^ 0. Explique como você pode calcular: 

a. P(-1,72<Z< -0,55) 

b. P(-l,72<Z<0,55) 

É necessário tabelar <t>(z) para z negativo? Que pro- 
priedade da curva normal padrão justifica sua resposta? 

45. Considere os bebês nascidos no intervalo “normal" de 
37-43 semanas de gestação. Muitos dados apoiam a 
suposição de que, para os bebês nascidos nos Estados 
Unidos, o peso de nascimento possui distribuição nor- 
mal com média 3432 g e desvio padrão 482 g. [O ar- 
tigo “Are Babies Normal" (The American Statistician , 
1999, p. 298-302) analisou dados de um ano especí- 
fico. Para uma escolha significariva de intervalos de 
classe, um histograma não tinha aparência normal, 
mas, após mais investigações, determinou-se que isso 
acontecia devido a alguns hospitais medirem o peso 
em gramas e outros em onças (com aproximação para 
a próxima onça) e depois converterem para gramas. 
Uma escolha de intervalos de classe modificada resul- 
tou um histograma bem-descrito por uma distribui- 
ção normal.] 

a. Qual é a probabilidade de o peso de nascimento de 
um bebê selecionado aleatoriamente exceder 4000 
gramas? Estar entre 3000 e 4000 gramas? 

b. Qual é a probabilidade de o peso de um bebê sele- 
cionado aleatoriamente ser inferior a 2000 gramas 
ou superior £ 5000 gramas? 

• c. Qual é £ probabilidade de o peso de nascimento de um 
bebê selecionado aleatoriamente exceder 7 libras? 
Como você caracterizaria o 0, 1 % mais extremo de 
todos os pesos de nascimento? 


e. Se X for uma variável aleatória com distribuição nor- 
mal e a for uma constante numérica ( a # 0), então 
Y = aX também terá uma distribuição normal. Use 
isso para determinar a distribuição do peso de nasci- 
mento expresso em libras (formato, média e desvio 
padrão) e então calcule novamente a probabilidade da 
parte (c). Como isso se compara à resposta anterior? 

46 . Em resposta às preocupações sobre o conteúdo nutri- 
cional dos fastfoods , o McDonald’s anunciou que usa- 
rá um novo óleo na fritura de suas batatas. O produto 
diminuirá substancialmente os níveis de ácido de gor- 
dura trans e aumentará a quantidade de gordura poliin- 
saturada mais benéfica. A empresa alega que 97 dentre 
100 pessoas não conseguem detectar diferença no gosto 
entre o óleo antigo e o novo. Assumindo que esse valor 
esteja correto (como proporção de longo prazo), qual é 
a probabilidade aproximada de, em uma amostra de 
1000 indivíduos que compraram fritas no McDonald's, 

a. ao menos 40 sentirem a diferença de gosto entre os 
dois óleos? 

b. no máximo 5% sentirem a diferença de gosto entre 
os dois óleos? 

47 . A desigualdade de Chebyshev, apresentada no Exercí- 
cio 43 (Capítulo 3), é válida para distribuições discretas 
e contínuas. Ela afirma que, para qualquer número k 
que satisfaça 1, P(\X — p.\ ^ ka) ^ \/k 2 (con- 
sulte o Exercício 43 no Capítulo 3 para obter uma in- 
terpretação). Obtenha essa probabilidade no caso de 
uma distribuição normal para k = 1, 2 e 3 e a compare 
ao limite superior. 

48 . Seja por X o número de falhas em um rolo de 100 m de 
fita magnética (uma variável de valores inteiros). 
Suponha que X tenha uma distribuição aproximada- 
mente normal com \i = 25 e ar = 5. Use a correção de 
continuidade para calcular a probabilidade de o número 
de falhas: 

a. estar entre 20 e 30, inclusive. 

b. ser no máximo 30. Inferior a 30. 

49 . Assuma X com uma distribuição binomial de parâ- 
metros n = 25 e p. Calcule cada uma das probabi- 
lidades a seguir, usando a aproximação normal (com 
correção de continuidade) para os casos p = 0,5, 0,6 e 
0,8 e compare com as probabilidades exatas calculadas 
pela Tabela A. 1 do Apêndice. 

a. P( 15<X<20) 

b. P(X < 15) 

c. P( 20 < X) 

50. Suponha que 10% de todos os eixos de aço produzidos 
por um processo específico não estejam em conformi- 
dade mas possam ser retrabalhados (em vez de serem 
sucateados). Considere uma amostra aleatória de 200 
eixos e represente por X o número dentre eles que não 
estejam conforme e possam ser retrabalhados. Qual é a 
probabilidade (aproximada) de X ser: 

a. No máximo 30? 
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b. Menos que 30? 

c. Estar entre 15 e 25 (inclusive)? 

51. Suponha que apenas 40% de todos os motoristas de um 
estado específico usem o cinto de segurança regular- 
mente. É selecionada uma amostra de 500 motoristas. 
Qual é a probabilidade de: 

a. entre 1 80 e 230 (inclusive) motoristas usarem o cinto 
de segurança regularmente? 

b. menos de 175 dos motoristas da amostra usarem o 
cinto regularmente? Menos dc 150? 

52. Mostre que a relação entre um percentil normal geral e 
o percentil correspondente z atende ao que foi dito nes- 
ta seção. 


b. Se, quando medida em °C, a temperatura tem dis- 
tribuição normal com média 1 15 e desvio padrão 2, 
o que se pode dizer sobre a distribuição da tempera- 
tura medida em °F? 


54. Não há uma boa fórmula para a fdc normal padrão <t>(z), 
mas foram publicadas diversas aproximações razoá- 
veis. A aproximação a seguir foi obtida em “Appro- 
ximations for Hand Calculators Using Small Integer 
Coefficients" ( Mathematics of Computation, 1977, p. 
214-222). Para 0 < z < 5,5, 


P(Z > z) = 1 - 4>(z) 

0,5 exp |— 351J g_+_ 562. 11 
H l L 703/i + 165 Jj 


53. a. Mostre que, se X tem distribuição normal com 
parâmetros p e cr, então Y = aX 4- b (função linear 
de X) também tem distribuição normal. Quais são os 
parâmetros da distribuição de Y [ou seja, E(Y) e 
V(Y)]1 [ Sugestão : escreva a FDA de K, P(Y ^ y) 
como uma integral que envolve a fdp de X e então 
faça a diferenciação em relação a y para obter a fdp 
de y.] 


O erro relativo dessa aproximação é inferior a 0,042%. 
Use isso para calcular aproximações das probabilidades 
a seguir e as compare com as probabilidades obtidas na 
Tabela A. 3 do Apêndice, sempre que possível. 

a. P(Z> 1) 

b. P(Z < -3) 

c. P(- 4 < Z < 4) 

d. P(Z > 5) 


t 

4.4 I A Distribuição Gama e Seus Parentes 


O gráfico de qualquer fdp normal tem formato de sino e é simétrico. Há várias situações práticas em que a variá- 
vel de interesse do investigador pode ter distribuição com inclinação. Uma família de fdp que fornece diversos 
formatos de distribuições com inclinação é a família gama. Para defini-la, precisamos antes apresentar uma 
função que tem importante papel em vários ramos da matemática. 


DEFINIÇÃO 


Para a > 0, a função gama Ra) é definida por 

Ra) = J fí x a ~ , e~ x dx 


(4.5) 


As propriedades mais importantes da função gama são as seguintes: 

1. Para qualquer a > 1, Ra) = (a — 1) • Ra - 1) [via integração por partes] 

2. Para qualquer inteiro positivo, n , Rn) = (n — 1)! 

3. r$ = 

Pela Expressão (4.5), se tivermos 


/(*; «) 


X a 'e * 

Ra) 

0 


Jt>0 

caso contrário 


(4.6) 


então f(x\ a)â0e E/( x; a) dx = Ra)/Ra) = 1 . então /(*; a) satisfaz às duas propriedades básicas de uma fdp. 
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A Família de Distribuições Gama 


DEFINIÇÃO Diz-se que uma variável aleatória contínua X tem uma distribuição gama se a fdp de X é 

1 


/(*; a, /3) = 


P°na) 


jc>0 


(4.7) 


0 


caso contrário 


onde os parâmetros a e (3 satisfazem a > 0, 0 > 0. A distribuição gama padrão tem 
(3 = 1 , de forma que a fdp de uma va gama padrão é dada por (4.6). 


A Figura 4.26(a) ilustra os gráficos da fdp gama f(x; a, (3) para diversos pares (a, /3), enquanto a Figura 
4.26(b) apresenta os gráficos da fdp gama padrão. Para a fdp-padrão, quando a s 1 , f(x\ a) for estritamente de- 
crescente à media que x aumenta a partir de 0. Quando a > 1 , /( x\ a) aumenta a partir de 0 em .t = 0 até um 
máximo e depois decresce. O parâmetro (3 em (4.7) é denominado parâmetro de escala porque os valores dife- 
rentes de 1 esticam ou comprimem a fdp na direção de x. 


f(x\a.P) 



f(x\a ) 



1 2 3 4 5 

(b) 


Figura 4.26 (a) Curvas de densidade gama; (b) curvas de densidade gama padrão 


E(X ) e E(X 2 ) podem ser obtidos a partir de uma integração razoavelmente direta e então V(X) = E(X 2 ) - 

[E(X)}\ 

A média e a variância de uma variável aleatória X com distribuição gama/(jt; a. (3) são 

E(X) = p = a(3 V(X) = or 2 = a/3 2 


Quando X é uma va gama-padrão, a fdc de X, 

F(x; a) = f ^ 6 dy x > 0 (4.8) 

Jo T(a) 

é denominada função gama incompleta [algumas vezes a função gama incompleta se refere à Expressão (4.8) 
sem o denominador T(a) no integrando], Há extensas tabelas de F(x\ a) disponíveis. Na Tabela A.4 do Apêndice, 
apresentamos uma pequena tabulação para a = 1,2,..., 10 e x= 1,2,..., 15. 

[ Exemplo 4.20 

Suponha que o tempo de reação X de um indivíduo selecionado aleatoriamente a um certo estímulo possui uma 
distribuição gama padrão com a = 2 segundos. Como 

P{a<X<b) = F(b) - F(a) 
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quando X é contínuo, 

F(3 < X < 5) = F( 5; 2) - F(3; 2) = 0,960 - 0,801 = 0,159 
A probabilidade de o tempo de reação ser mais de 4 segundos é 

P(X > 4) = 1 - P(X < 4) = 1 - F(4; 2) = 1 - 0,908 = 0,092 ■ 

A função gama incompleta também pode ser usada para calcular probabilidades que envolvam distribuições 
gama não-padrão. 


PROPOSIÇÃO Seja X com uma distribuição gama de parâmetros a e /3. Então, para qualquer x > 0, a fdc 
de X é dada por 

P(X < x) = F(x, a,(3) = F a) 
onde F(*; a) é a função gama incompleta. 2 

Exemplo 4.21 

Suponha que o tempo de sobrevivência X em semanas de um camundongo macho selecionado aleatoriamente 
exposto a 240 rads de radiação gama tenha distribuição gama com a = 8 e /3 = 15. (Dados em Survival Distri- 
butions: Reliability Applications in the Biomedical Services, de A. J. Gross e V. Clark, sugerem a »» 8,5 e )8 ** 
13,3.) O temp o esperado de sobrevida é E(X) = (8)( 1 5) = 120 semanas, enquanto V(X) = (8)(15) 2 = 1800 e 
a x = Vl800 = 42,43 semanas. A probabilidade de um camundongo sobreviver entre 60 e 120 semanas é 

P(60 < X < 120) = P(X < 120) - P(X < 60) 

= F(120/15; 8) - F(60/15; 8) 

= F(8; 8) - F(4; 8) = 0,547 - 0,051 = 0,496 

A probabilidade de um camundongo sobreviver ao menos 30 semanas é 

P(X > 30) = 1 - P(X < 30) = 1 - P(X < 30) 

= 1 - F(30/15; 8) = 0,999 ■ 



A família de distribuições exponenciais fornece modelos probabilísticos largamente usados em engenharia e em 
várias disciplinas da ciência. 


Diz-se que X tem uma distribuição exponencial com parâmetro À (À > 0) se a fdp de X for 


♦ 
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Tanto a média como o desvio padrão da distribuição exponencial são iguais a 1/À. São exibidos diversos 
gráficos das fdps exponenciais na Figura 4.27. 



Figura 4.27 Curvas de densidade exponencial 

Diferentemente da fdp gama geral, a fdp exponencial pode ser facilmente integrada. Em particular, a fdc de 
Xé 


«**>-{ i-.~ 


x < 0 
x>0 


Exemplo 4.22 

Suponha que o tempo de resposta X em um terminal de computador on-line específico (o tempo entre o final de 
uma consulta de um usuário e o começo da resposta do sistema para essa consulta) tenha distribuição exponen- 
cial com tempo de resposta esperado igual a 5 segundos. Então E(X) = 1/À = 5, com A = 0,2. A probabilidade 
de o tempo de resposta ser no máximo 10 segundos é 

P(X < 10) = F(10; 0,2) = 1 - fr <a2 * ,0 > = 1 - e~ 2 = 1 - 0,135 = 0,865 


A probabilidade de o tempo de resposta estar entre 5 e 10 segundos é 

P(5 < X< 10) = F(10; 0,2) - F(5; 0,2) 

= (1 - e~ 2 ) - (1 - e-') = 0,233 ■ 

A distribuição exponencial é usada freqüentemente como modelo para distribuição dos tempos entre a ocor- 
rência de eventos sucessivos, tais como clientes chegando em uma unidade de atendimento ou chamadas em uma 
central telefônica. O motivo disso é que a distribuição exponencial está fortemente relacionada ao processo de 
Poisson discutido no Capítulo 3. 


PROPOSIÇÃO 


Suponha que o número de eventos que ocorrem em um intervalo de tempo de duração t 
tenha distribuição de Poisson com parâmetro at (onde a, a taxa do processo do evento, é 
o número esperado de eventos que ocorrem em uma unidade de tempo) e que os números 
das ocorrências em intervalos não-sobrepostos sejam independentes um do outro. Então a 
distribuição do tempo decorrido entre a ocorrência de dois eventos sucessivos é exponen- 
cial com parâmetro À = a. 


Apesar de uma demonstração completa estar além do escopo do livro, o resultado é facilmente verificado 
para o tempo X,, até que ocorra o primeiro evento: 
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P(X | < r) = 1 — P(X t > t) = 1 — P[nenhum evento em (0, f)] 
e~ at • (at)° 

= 1 - - — - 7 ^- = 1 - e~ M 
0 ! 

que é exatamente a FDA da distribuição exponencial. 

Exemplo 4.23 

Suponha que sejam recebidas chamadas em um serviço telefônico de “auxílio a suicidas” 24 horas, de acordo 
com um processo de Poisson com taxa a = 0,5 chamada por dia. Então o número de dias X entre chamadas su- 
cessivas tem uma distribuição exponencial com valor de parâmetro 0,5, de forma que a probabilidade de haver 
mais de 2 dias entre chamadas é 

P(X > 2) = 1 - P(X < 2) = 1 - F( 2; 0,5) = e~ i0 ^ 2) = 0,368 


O tempo esperado entre chamadas sucessivas é 1/0,5 = 2 dias. 


Outra aplicação importante da distribuição exponencial é modelar a distribuição do tempo de vida de um 
componente. O motivo parcial da popularidade dessas aplicações é a propriedade de “falta de memória" da dis- 
tribuição exponencial. Suponha que o tempo de vida de um componente seja distribuído exponencialmente com 
o parâmetro À. Após o componente ser colocado em serviço, saímos por um período de r„ horas e então retomamos 
para encontrar o componente ainda funcionando. Nesse caso, qual é a probabilidade de ele durar ao menos t ho- 
ras adicionais? Em símbolos, queremos P(X S: t + t 0 \ X a t 0 ). Pela definição de probabilidade condicional, 


P(X>t + t 0 \x>t 0 ) = 


/>[(X^ r + r 0 ) n(X 
PiX s t 0 ) 


Entretanto, o evento, Xâ/ O no numerador é redundante, já que os dois eventos podem ocorrer se, e somente 
se, X a t + t 0 . Portanto, 


P(X>f + r 0 |x>f 0 ) = 


P(X > t + f 0 ) 1 -F(/ + r„; A) 

P(X >í 0 ) 1 - F(í 0 ; A) 


= e 


-Al 


Tal probabilidade condicional é idêntica à probabilidade original P(X ^ t) de o componente ter durado t ho- 
ras. Assim, a distribuição do tempo de vida adicional é exatamente igual à distribuição original de tempo de 
vida , de forma que em cada ponto no tempo o componente não dá sinais de desgaste. Em outras palavras, a dis- 
tribuição do tempo de vida restante é independente da idade atual. 

Embora a propriedade de ausência de memória possa ser justificada pelo menos, aproximadamente, em 
muitos problemas aplicados, em outras situações os componentes se deterioram ou ocasionalmente melhoram 
com o uso (ao menos até certo ponto). Modelos mais gerais de tempo de vida são fornecidos pelas distribuições 
gama, Weibull e lognormal (as duas últimas serão discutidas na próxima seção). 


A Distribuição Qui-Quadrado 


DEFINIÇÃO 


Seja v um inteiro positivo. Diz-se que uma variável aleatória X possui uma distribuição 
qui-quadrado com parâmetro i^sea fdp de X for a densidade gama com a = v!2 e (3 = 
2. A fdp de uma va qui-quadrado será 


/(*; v) = 


■■ ■ — . — y{v/2) 1 p—X/2 

2* V2 I>/2) 

0 


jc > 0 
x<0 


(4.10) 


O parâmetro v é denominado número de graus de liberdade (gl) de X. O símbolo x 2 fre- 
quentemente é usado no lugar de “qui-quadrado". 


Variáveis Aleatórias Contínuas e Distribuições de Probabilidade - Jay L. Devore 157 


A distribuição qui-quadrado é importante por ser a base de diversos procedimentos de inferência estatís- 
tica. 0 motivo disso é que as distribuições qui-quadrado estão intimamente relacionadas a distribuições normal 
(consulte o Exercício 65). Discutiremos a distribuição qui-quadrado com mais detalhes nos capítulos sobre in- 
ferência. 


Exercícios I Seção 4.4 (55-65) 

55. Calcule os dados a seguir: 

a. m 

b. T(5/2) 

c. F( 4; 5) (a função gama incompleta) 

d. F(5; 4) 

e. F(0; 4) 

56. Seja X uma distribuição gama-padrão com a = 7. Cal- 
cule o seguinte: 

a. />(X< 5) 

b. P(X < 5) 

c. P(X> 8) 

d. P(3 < X < 8) 

e. P(3 < X < 8) 

f. P(X < 4 ou X > 6) 

57. Suponha que o tempo gasto por um aluno selecionado 
aleatoriamente que usa um terminal conectado a uma 
instalação de computador com time-sharing tem uma 
distribuição gama com média de 20 minutos e variância 
de 80 min 2 . 

a. Quais são os valores de a e /3? 

b. Qual é a probabilidade de um aluno usar o terminal 
por no máximo 24 minutos? 

c. Qual é a probabilidade de um aluno passar entre 20 
e 40 minutos usando o terminal? 

58. Suponha que, quando um certo tipo de transistor é sujeito 
a um teste de vida acelerado, o tempo de vida X (em se- 
manas) possui distribuição gama com média 24 semanas 
e desvio padrão 12 semanas. 

a. Qual é a probabilidade de um transistor durar entre 1 2 
e 24 semanas? 

b. Qual é a probabilidade de um transistor durar no 
máximo 24 semanas? A mediana da distribuição do 
tempo de vida é inferior a 24? Por que ou por 
que não? 

c. Qual é o 99 2 percentil da distribuição do tempo 
de vida? 

d. Suponha que o teste seja finalizado após t semanas. 
Que valor de t faz com que apenas 0,5% de todos os 
transistores estejam operando no fim do teste? 

59. Seja X = tempo entre duas chegadas sucessivas no 
guichê de atendimento rápido de um banco local. Se X 
possui distribuição exponencial com A = 1 (que é idên- 
tico a uma distribuição gama-padrão com a = 1), cal- 
cule os itens a seguir: 

a. O tempo esperado entre duas chegadas sucessivas 

b. O desvio padrão do tempo entre chegadas sucessivas 


c. P(X<4) 

d. P(2 < X < 5) 

60. Seja X a distância (m) que um animal viaja desde seu 
local de nascimento até o primeiro local vago que en- 
contra. Suponha que, para ratos-cangurus de rabo de 
bandeira, X possui uma distribuição exponencial com 
parâmetro À = 0,01386 (como sugerido no artigo 
“Competition and Dispersai from Multiple Nests,” 
Ecology , 1997, p. 873-883). 

a. Qual é a probabilidade de a distância ser no máximo 
100 m? No máximo 200 m? Entre 100 e 200 m? 

b. Qual é a probabilidade de a distância exceder a mé- 
dia por mais de 2 desvios padrão? 

c. Qual é o valor da mediana da distância? 

61. Diversas experiências com determinado tipo de venti- 
lador, usados em motores a diesel, indicam que a dis- 
tribuição exponencial sugere um bom modelo para 
cálculo do tempo até uma falha. Suponha que o tempo 
médio seja 25.000 horas. Qual é a probabilidade de: 

a. um ventilador selecionado aleatoriamente durar pelo 
menos 20.000 horas? No máximo 30.000 horas? En- 
tre 20.000 e 30.000 horas? 

b. o tempo de vida de um ventilador exceder o valor 
médio em mais de 2 desvios padrão? Mais de 3 
desvios padrão? 

62. O caso especial da distribuição gama em que a é um in- 
teiro positivo n é denominado distribuição de Erlang. 
Se substituirmos /3 por 1/À na Expressão (4.7), a fdp 
Erlang será 

/U;A,n) = | (n — 1)! 

[ 0 jc < 0 

É possível demonstrar que, se os tempos entre os even- 
tos sucessivos forem independentes, cada um com uma 
distribuição exponencial de parâmetro A, o tempo total 
X antes de todos os n próximos eventos ocorrerem terá 
fdp f(x; À, n). 

a. Qual é o valor esperado de X? Se o tempo (em minu- 
tos) entre as chegadas de clientes sucessivos for dis- 
tribuído exponencialmente com À = 0,5, quanto 
tempo podemos esperar que passe antes da chegada 
do décimo cliente? 

b. Se o tempo entre as chegadas de clientes for dis- 
tribuído exponencialmente com À = 0,5, qual é a 
probabilidade de o décimo cliente (depois do que 
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acabou de chegar) chegue dentro dos próximos 
30 minutos? 

c. O evento {X < /} ocorre se e somente se ao menos n 
eventos ocorrerem nas próximas t unidades de tem- 
po. Use o fato de que o número de eventos que ocor- 
rem em um intervalo de duração t possui uma 
distribuição de Poisson com parâmetro Àf para escre- 
ver uma expressão (envolvendo probabilidades de 
Poisson) para a FDA de Erlang F(r, À, n) = P(X ^ t). 

63. Um sistema consiste de cinco componentes idênticos 
conectados em série, conforme ilustrado: 


Se um componente falhar, todo o sistema falhará. 
Suponha que cada componente tenha um tempo de vida 
distribuído exponencialmente com A = 0,01 e que eles 
falhem de forma independente. Defina os eventos A t = 
{/-ésimo componente que dura no mínimo t horas >, i = 
1,..., 5, de forma que os Aj são eventos independentes. 
Seja X = momento da falha do sistema, isto é, o tempo 
de vida mais curto (mínimo) entre os cinco compo- 
nentes. 


a. O evento {X ^ f } é equivalente a que evento que en- 
volva A,, . . . , A 5 ? 

b. Usando a independência dos 4<s, calcule F(X ^ 0- 
Obtenha então F(t) = P(X ^ f) e a fdp de X. Que 
tipo de distribuição tem X? 

c. Suponha que haja n componentes, cada um com 
tempo de vida exponencial com parâmetro À. Que 
tipo de distribuição tem XI 

64. Se X tiver distribuição exponencial com parâmetro À, 
deduza uma expressão geral para o percentil (100/7) da 
distribuição. Então faça a especialização para obter 
a mediana. 

65. a. O evento {X 2 ^ y] é equivalente a que evento que 

envolve X? 

b. Se X tiver distribuição normal padrão, use a parte (a) 
para escrever a integral que iguala P(X 2 ^ y). Dife- 
rencie então essa expressão em relação a y para obter 
a fdp de X 2 [o quadrado de uma variável N(0, 1)]. Fi- 
nalmente, mostre que X 2 possui distribuição qui- 
quadrado com v = 1 gl [consulte (4.10)]. ( Sugestão : 
use a identidade a seguir). 

^ {/!o/(*) <**} =/IKy)l • b '(y) -fW(y)] • a'ly) 


4.5 I Outras Distribuições Contínuas 

As famílias de distribuições normal, gama (incluindo exponencial) e uniforme fornecem ampla variedade de 
modelos probabilísticos para variáveis contínuas, mas há muitas situações práticas em que nenhum membro 
dessas famílias consegue se enquadrar bem em um conjunto de dados observados. Os estatísticos e outros in- 
vestigadores desenvolveram outras famílias de distribuições que normalmente são apropriadas, na prática. 


A Distribuição de Weibull 

A família de distribuições de Weibull foi apresentada pelo físico sueco Waloddi Weibull, em 1939. Seu artigo de 
1951 “A Statistical Distribution Function of Wide Applicability” ( J . Applied Mechanics, vol. 18, p. 293-297) 
apresenta diversas aplicações. 


DEFINIÇÃO 


Uma variável aleatória X tem distribuição de Weibull com parâmetros a 

e p (a > 0, & > 

0) se a fdp de X for 



/(*; a,i 8) = ' 

— x“-'e-< x/A ‘ jc>0 

P° 

(4.11) 


0 x < 0 



Em algumas situações, há justificativas teóricas para a utilização da distribuição de Weibull. mas em muitas 
aplicações /( jt; a, /3) simplesmente fornece uma boa aproximação dos dados observados para valores específicos 
de a e /3. Quando a = 1, a fdp é reduzida à distribuição exponencial (com À = 1//3), de forma que a distribuição 
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exponencial é um caso especial das distribuições gama e de Weibull. Entretanto, há distribuições gama que não 
são distribuições de Weibull e vice-versa, o que faz com que uma família não seja um subconjunto da outra. 
Tanto a como /3 podem variar para se obter diversos formatos de distribuição diferentes, como ilustrado na 
Figura 4.28. p é um parâmetro de escala, de forma que valores diferentes esticam ou comprimem o gráfico na 
direção de x. 

Integrar para obter E(X) e E(X 2 ) resulta em 


P = 



=í 1 r ( 1+ «H r ( 1+ «)J} 


0 cálculo de fi e de a 2 necessita, portanto, da função gama. 

A integração /Óf(y: a, (5) dy pode ser feita facilmente para obter a fdc de X. 


w* ■' 

A fdc de uma va de Weibull com parâmetros ae| 3 é 



f 0 x<0 

(4.12) 


F(x-,a,P) = { l _ e ^ x ^ Q 


Exemplo 4.24 

Nos últimos anos, a distribuição de Weibull tem sido usada para modelar emissões de poluentes de vários mo- 
tores. Seja X o valor da emissão de NO, (g/gal) a partir de certo tipo de motor de quatro tempos selecionado 
aleatoriamente e suponha que X possua uma distribuição de Weibull com a = 2 e /3 = 10 (sugerido pelas infor- 
mações do artigo “Quantification of Variability and Uncertainty in Lawn and Garden Equipment NO, and Total 
Hydrocarbon Emission Factors,” J. ofthe Air and Waste Management Assoe., 2002, p. 435-448). A curva de den- 
sidade correspondente tem a mesma aparência daquela da Figura 4.28 para a = 2, p = 1, exceto pelo fato 
de que agora os valores 50 e 100 substituem 5 e 10 no eixo horizontal (porque /3 é uma “parâmetro de esca- 
la”). Então 


P(X < 10) = F(10; 2, 10) = 1 - íT (,0 ' ,0)I =1-<T» = 0,632 


De forma similar, P(X £ 25) = 0,998, de maneira que a distribuição está quase inteiramente concentrada 
nos valores entre 0 e 25. O valor c, que separa os 5% de todos os motores que emitem as maiores quantidades 
de NO, dos 95% restantes, satisfaz 


0,95 = 1 - e" <c/10>1 

Isolando o termo exponencial em um lado, tirando os logaritmos e resolvendo a equação resultante, temos 
c ~ 17,3 como o 95 a percentil da distribuição de tempos de vida. ■ 

Freqüentemente. em situações práticas, o modelo de Weibull é razoável, exceto pelo fato de que o menor 
valor X possível pode ser um valor y não assumido como zero (isso também se aplica a um modelo gama). A 
quantidade y pode então ser vista como um terceiro parâmetro da distribuição, que foi o que Weibull fez em seu 
trabalho original. Para, digamos, y = 3, todas as curvas na Figura 4.28 seriam deslocadas 3 unidades para a di- 
reita. Isso é equivalente a dizer que X —y possui a fdp (4. 1 1), de forma que a fdc de X é obtida pela substituição 
de x em (4. 1 2) por x — y. 
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fix) 



fix) 



Exemplo 4.25 

Seja X = perda de massa por corrosão de um pequeno prato quadrado de uma liga de magnésio imersa du- 
rante 7 dias em uma solução aquosa inibida de 20% de MgBr 2 . Suponha que a menor perda de massa possível 
seja y = 3 e que o excesso X - 3, além desse mínimo, tenha distribuição de Weibull com a = 2 e j3 = 4. 
(Esse exemplo foi considerado em “Practical Applications of the Weibull Distribution,” industrial Quality 
Control , Ago., 1964. p. 71-78. Os valores deaejS foram escolhidos como 1,8 e 3,67, respectivamente, em- 
bora no artigo tenha sido usada uma escolha de parâmetros ligeiramente diferente.) A fdc de X será então 

F(x; a, /3, y) = F(x; 2,4,3) = {j _ *>3 


Portanto, 


P(X > 3,5) = 1 - F(3,5; 2, 4, 3) = cr 0 - 0 ' 56 = 0,985 


e 


P(7 < X < 9) = 1 — e~ 2M - (1 - e-') = 0,895 - 0,632 = 0,263 
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A Distribuição Lognormal 


DEFINIÇÃO 


Diz-se que uma va não-negativa X possui uma distribuição lognormal se a va Y = ln(X) 

possui uma distribuição normal. A fdp resultante de uma 
tiver distribuição normal com parâmetros ixt cr é 

va lognormal quando ln(X) 


[Inf r)-ji .J*/(2/r 

jc > 0 

f(x-, /x, cr) = ' 

VZm <TX 


0 

x<0 


Tenha cuidado neste caso. Os parâmetros ix e cr não são a média e o desvio padrão de X e sim de ln(X). A 
média e a variância de X são 


E(X) = e V(X) = e 2 ^ 1 • - 1) 


No Capítulo 5, apresentaremos uma justificativa teórica para essa distribuição, relacionada ao Teorema do 
Limite Central, mas, assim como ocorre com outras distribuições, a lognormal pode ser usada como modelo, 
mesmo na ausência de tal justificativa. A Figura 4.29 ilustra os gráficos da fdp lognormal. Embora a curva nor- 
mal seja simétrica, a lognormal possui inclinação positiva. 

Como ln(X) possui distribuição normal, a fdc de X pode ser expressa em termos da fdc <I>(z) de uma va Z 
normal padrão. Para x s 0, 


F(x; /i, cr) = P(X < x) = P[ln(X) < ln(x)] 

= p[z < ln(y) ~ v j 


(4.13) 


A*) 



Figura 4.29 Curvas de densidade lognormal 


Exemplo 4.26 

A distribuição lognormal é usada freqüentemente como modelo para diversas propriedades de materiais. O ar- 
tigo “Reliability of Wood Joist Floor Systems with Creep” ( J . of Structural Engr., 1995, p. 946-954) sugere que 
a distribuição lognormal com n = 0,375 e a = 0,25 é um modelo plausível para X = módulo da elasticidade 
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(MOE, em 10 6 psi) de sistemas de vigas de madeira construídos de hem-fir grau número 2. O valor da média e 
a variância de MOE são 

E(X) = e 0375 + <0 - 25)2 ' 2 = e 0 - 40625 = 1,50 
V(X) = e 0 - 8125 ^ 0625 - 1) = 0,1453 

A probabilidade de MOE estar entre 1 e 2 é 


/>(1 < X < 2) = />(ln(l) < ln(X) < ln(2)) 
= P( 0 < ln(X) < 0,693) 


= p( 0 - 0,375 < z < 0,693 - 0,375 \ 
V 0,25 0,25 / 


= 4>(1,27) -<J> (-1,50) = 0,8312 

Que valor c faz com que apenas 1% dos sistemas tenha MOE que exceda c? Desejamos o c para que 

0,99 = P(X < c) = p[z < ln(C ) Q ~ 25 ’ 375 ) j 

a partir de onde (ln(c) - 0,375)/0,25 = 2,33 e c = 2,605. Portanto, 2,605 é o 99“ percentil da distribuição 
de MOE. ■ 




Distribuição Beta 

Todas as famílias de distribuições contínuas discutidas até agora, exceto a distribuição uniforme, têm densidade 
positiva em um intervalo infinito (apesar de normalmente a função densidade decrescer rapidamente para zero 
além de alguns desvios padrão em relação à média). A distribuição beta fornece densidade positiva apenas para 
X em um intervalo de comprimento finito. 


DEFINIÇÃO 


Diz-se que uma variável aleatória X possui distribuição beta com parâmetros a, (3 (am- 
bos positivos), A e B se a fdp de X for 


f(x; a, /3, A, B) = 


B 


J r(a+p) ASxSB 

-A na)-r(P)\B-AI U-^J 


caso contrário 


O caso A = 0, B = 1 fornece a distribuição beta-padrão. 


A Figura 4.30 ilustra diversas fdps beta-padrão. Os gráficos da fdp geral são similares, exceto pelo fato de 
que os valores são deslocados e então comprimidos ou estendidos para se adaptarem a [A, B]. A menos que a e 
/3 sejam inteiros, a integração da fdp para calcular probabilidades é difícil, de forma que normalmente é 
usada uma tabela da função beta incompleta. A média e a variância de X são 

^ 


lx = A + {B-A) 


a 


a + 13 


( B - AfaJ3 


(a+ma+l 3+1) 
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/U; a, /3) 
5 


4 



a — 2 

P = 0,5 


3 


2 


X 


0 (U 0,4 0,6 0,8 


Figura 4.30 Curvas de densidade beta-padrão 


Exemplo 4.27 


0s gerentes de projeto normalmente usam um método denominado PERT (técnica de revisão e avaliação de pro- 
grama) para coordenar as diversas atividades de um projeto grande (uma aplicação de sucesso foi a construção 
da espaçonave Apollo.) Uma hipótese-padrão na análise PERT é que o tempo necessário para completar qual- 
quer atividade específica depois de seu início tem uma distribuição beta com A = tempo otimista (se tudo cor- 
rer bem) e B = tempo pessimista (se tudo correr mal). Suponha que, na construção de uma casa, o tempo X (em 
dias) necessário para a construção das fundações possui distribuição beta com A = 2, Z? = 5, a = 2, e/3 = 3. 
Então a/(a + (3) = 0,4, de forma que £(X) = 2 4- (3)(0,4) = 3,2. Para esses valores de a e /3, a fdp de X é uma 
função polinomial simples. A probabilidade de levar no máximo 3 dias para construir os alicerces é 


uma quantidade que ocorre em diferentes amostras, tal como a proporção de um dia de 24 horas em que um in- 
divíduo está dormindo ou a proporção de determinado elemento em um composto químico. 




A distribuição beta-padrão normalmente é usada para modelar a variação na proporção ou porcentagem de 


Exercícios Seção 4.5 (66-80) 


66. 0 tempo de vida X (em centenas de horas) de certo tipo 
de válvula eletrônica possui uma distribuição Weibull 
com parâmetros ar = 2 e = 3. Calcule os itens 

a seguir: 


( IEEE Trans. on Elect. Insulation , 1985, p. 519-522) 
declararam que “a distribuição de Weibull é largamente 
usada em problemas estatísticos relativos ao desgaste 
de materiais isolantes sólidos sujeitos ao desgaste e à 
tensão”. Eles propõem o uso da distribuição como um 
modelo para tempo (em horas) de falha de amostras de 
isolantes sólidos sujeitos a voltagem de AC. Os valores 
dos parâmetros dependem da voltagem e da tempe- 
ratura. Suponha que a = 2,5 e = 200 (valores sugeri- 
dos pelos dados no artigo) 


a. E(X) e V(X) 

b. />(X<6) 

c. P( 1,5<X<6) 


(Essa distribuição de Weibull é sugerida como modelo 
de tempo em serviço em “On the Assessment of Equip- 
ment Reliability: Trading Data Collection Costs for 
Precision,”/ Engr Manuf., 1991, p. 105-109.) 


a. Qual é a probabilidade de o tempo de vida de um 


67. Os autores do artigo “A Probabilistic Insulation Life 
Model for Combined Thermal-Electrical Stresses” 


espécime ser no máximo 250? Inferior a 250? Maior 


de 300? 
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b. Qual é a probabilidade de o tempo de vida de uma 
amostra estar entre 100 e 250? 

c. Que valor faz com que 50% de todas as amostras 
tenham tempos de vida que excedam o valor? 

68. Seja X = tempo (em 10 1 semanas) desde a remessa de 
um produto com defeito até que o cliente o devolva. 
Suponha que o tempo mínimo de retomo seja y = 3,5 e 
que o excesso X - 3,5 acima do mínimo possua uma 
distribuição de Weibull com parâmetros a - 2 e /3 = 
1 ,5 (consulte o artigo Industrial Quality Contrai , men- 
cionado no Exemplo 4.25). 

a. Qual é a FDA de X? 

b. Quais são o tempo de retomo esperado e a variância 
do tempo de retomo? [ Sugestão : Primeiro obtenha 
E(X - 3,5) e V(X - 3,5).] 

c. Calcule P(X > 5). 

d. Calcule P ( 5 < X < 8). 

69. Seja X com distribuição de Weibull e a fdp da Ex- 
pressão (4.11). Demonstre que /x = /3T(1 4- l/a). ( Su- 
gestão : na integral de £(X), faça a mudança de variável 
y = (jc// 3)'*, de forma que x = py l,a .) 

70. a. No Exercício 66, qual a mediana do tempo de vida 

das válvulas? [ Sugestão : use a Expressão (4.12).] 

b. No Exercício 68, qual é a mediana do prazo de 
retomo? 

c. Se X tiver uma distribuição de Weibull com a fdc da 
Expressão (4.12), obtenha uma expressão geral para 
o (lOOp)ésimo percentil da distribuição. 

d. No Exercício 68, a empresa deseja recusar devo- 
luções após t semanas. Para que valores de t apenas 
10% de todas as devoluções serão recusadas? 

71. Seja X o limite de resistência à tração (ksi) a -200° de 
um corpo de prova de aço selecionado aleatoriamente 
que apresenta “fragilidade ao frio” em baixas tempera- 
turas. Suponha que X tenha distribuição de Weibull com 
a = 20e/3 = 100. 

a. Qual é a probabilidade de X ser no máximo 105? 

b. Se forem selecionados vários corpos de prova um 
após o outro, qual é a probabilidade no longo prazo 
de obter valores de resistência entre 100 e 105 ksi? 

c. Qual é o valor da mediana da distribuição de 
resistência? 

72. Os autores do artigo em que foram obtidos os dados do 
Exercício 1.27 sugerem que um modelo de probabili- 
dade razoável para a vida útil de uma broca é a dis- 
tribuição lognormal com /x = 4.5 e a = 0,8. 

a. Qual é o valor da média e o desvio padrão da 
vida útil? 

b. Qual é a probabilidade da vida útil ser no máxi- 
mo 100? 

c. Qual é a probabilidade da vida útil ser no mínimo 
200? Maior que 200? 

73. Seja X = potência média horária (em decibéis) de 
sinais de rádio recebidos transmitidos entre duas 
cidades. Os autores do artigo “Families of Distributions 
for Hourly Median Power and Instantaneous Power of 


Received Radio Signals” (/ Research National Bureau 
of Standards , vol. 67D, 1963, p. 753-762) argumentam 
que a distribuição lognormal fornece um modelo proba- 
bilístico razoável para X. Se os valores dos parâmetros 
forem /x = 3,5 e cr = 1,2, calcule os itens a seguir: 

a. O valor médio e o desvio-padrão da potência re- 
cebida. 

b. A probabilidade de a potência recebida estar entre 
50 e 250 dB. 

c. A probabilidade de X ser menor que o valor da mé- 
dia. Por que a probabilidade não é 0,5? 

74. a. Use a Equação (4.13) para escrever uma fórmula 

para a mediana /x da distribuição lognormal. Qual é 
a mediana da distribuição do Exercício 73? 
b. Lembrando que Zaé a notação do percentil KXX 1 - a) 
da distribuição padrão normal, escreva uma ex- 
pressão para o percentil 100(1 — a) da distribuição 
lognormal. No Exercício 73, que valor a potência re- 
cebida excederá apenas 5% do tempo? 

75. Uma justificativa teórica baseada no mecanismo de 
falha de certo material admite a hipótese de que a re- 
sistência dúctil X de um material possui distribuição 
lognormal. Suponha que os parâmetros sejam /x = 5 e 
(7 = 0,1. 

a. Calcule E(X) e V(X). 

b. Calcule P(X > 125). 

c. Calcule P(\ 10 <X< 125). 

d. Qual é o valor da mediana da resistência dúctil? 

e. Se 10 diferentes amostras de uma liga de aço desse 
tipo forem submetidas a um teste de resistência, 
quantas você espera que tenham ao menos 125? 

f. Se 5% dos menores valores não forem aceitáveis, 
qual seria a resistência mínima aceitável? 

76. O artigo “The Statistics of Phytotoxic Air Pollutants” 
(J. Royal Stat. Soc ., 1989, p. 183-198) sugere a dis- 
tribuição lognormal com um modelo de concentração 
de S0 2 sobre uma floresta específica. Suponha que os 
valores dos parâmetros sejam /x = 1 ,9 e cr = 0,9. 

a. Qual é o valor médio e o desvio padrão da con- 
centração? 

b. Qual é a probabilidade de a concentração ser no 
máximo 10? Entre 5 e 10? 

77. Que condição de a e pé necessária para que a fdp beta- 
padrão seja simétrica? 

78. Suponha que a proporção X da área coberta por uma de- 
terminada planta em um quadrante selecionado aleato- 
riamente possui distribuição beta-padrão com a = 5 e 
P — 2. 

a. Calcule E(X) e V(X). 

b. Calcule P(X < 0,2). 

c. Calcule P( 0,2 ^ X ^ 0,4). 

— ^ d. Qual é a proporção esperada da região de amostra- 
gem não coberta pela planta? 

79. Assuma que X tenha densidade beta-padrão com parâ- 
metros a e / 3. 
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a. Demonstre a fórmula de E(X) fornecida na seção. 

b. Calcule £[(1 - X) m ]. Se X representa a proporção de 
uma substância formada por um determinado ingre- 
diente, qual é a proporção esperada que não é for- 
mada por ele? 

80. É aplicada uma força em uma barra de aço de 20 pol. 
presa nas duas extremidades. Seja Y = distância da 


quebra da barra em relação à extremidade esquerda. 
Suponha que >720 possui uma distribuição beta com 
E(Y)= 10 e V(Y) = 

a. Quais são os parâmetros da distribuição beta-padrão 
correspondente? 

b. Calcule P(8< Y< 12). 

c. Calcule a probabilidade de a barra quebrar a mais de 
2 pol. de onde você espera. 


4.6 


Gráficos de Probabilidade 


Um investigador normalmente obtém uma amostra numérica x u e deseja saber se é plausível ela ter 

vindo de uma distribuição de população de um tipo específico (por exemplo, de uma distribuição normal). 
Muitos procedimentos formais de inferência estatística se baseiam na hipótese de que a distribuição da popu- 
lação é de um tipo especificado. O uso de tal procedimento não é apropriado se a distribuição de probabilidades 
subjacente for muito diferente do tipo assumido. Além disso, a compreensão da distribuição subjacente algumas 
vezes pode fornecer percepções dos mecanismos físicos envolvidos na geração dos dados. Uma forma eficiente 
de verificar uma hipótese de distribuição é construir o que chamamos de gráfico de probabilidade. A essência 
desse gráfico é que, se a distribuição na qual ele se baseia estiver correta, seus pontos estarão próximos a uma 
linha reta. Se a distribuição real for muito diferente da usada para criar o gráfico, os pontos diferem subs- 
tancialmente do padrão linear. 

Percentis da Amostra 

Os detalhes envolvidos na construção de gráficos de probabilidade são um pouco diferentes de fonte para fonte. 
A base da nossa construção é a comparação entre os percentis dos dados da amostra e os percentis corres- 
pondentes da distribuição consideradas. Lembre-se que o (100/?)ésimo percentil de uma distribuição contínua 
com fdc F(*) é o número 7j(p) que satisfaz F(rj(p)) = p. Isto é, r)(p) é o número na escala de medida tal que a 
área sob a curva de densidade à esquerda de rj(p) é p. Assim, o 50* percentil tj( 0,5) satisfaz F(tj( 0,5)) = 0,5, e 
o 90 percentil satisfaz F( 77(0,9)) = 0,9. Considere como exemplo a distribuição-padrão normal, para a qual 
representamos a fdc por <!>(•). Na Tabela A.3 do Apêndice, encontramos o 20* percentil localizando a linha e a 
coluna em que 0,2000 (ou um número o mais próximo dele) aparece na tabela. Como 0,2005 aparece na inter- 
seção da linha -0,8 e da coluna 0,04, o 20* percentil é aproximadamente -0,84. De forma similar, o 25* percentil 
da distribuição normal-padrão é (usando interpolação linear) aproximadamente -0,675. 

Grosso modo , os percentis da amostra são definidos da mesma forma que os da distribuição da população. 
050 percentil da amostra deve separar os 50% menores valores dos 50% maiores da amostra, o 90* percentil 
deve ser o limite entre 90% abaixo do valor e 10% acima, e assim por diante. Infelizmente encontramos pro- 
blemas quando tentamos calcular os percentis da amostra para uma amostra determinada de n observações. Se, 
por exemplo, n- 10, podemos dividir 20% desses valores ou 30% dos dados, mas nenhum valor dividirá exa- 
tamente 23% das 10 observações. Para nos aprofundarmos, precisamos de uma definição operaciònal de per- 
centis da amostra (local em que diferentes pessoas fazem coisas ligeiramente diferentes). Lembre-se de que, 
quando n é ímpar, a mediana da amostra, ou o 50* percentil, é o valor do meio na lista ordenada, por exemplo, 
o sexto maior valor quando n = 11. Isto significa considerar a observação do centro localizando-se metade na 
parte inferior dos dados e metade na superior. De forma similar, suponha n = 10. Então, se denominarmos o 
terceiro menor valor como 25* percentil, estaremos considerando metade desse valor o grupo inferior (formado 
pelas duas menores observações) e metade no grupo superior (as sete maiores observações). Tal consideração 
leva à seguinte definição geral de percentis da amostra: 
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DEFINIÇÃO 


Ordene as n observações da amostra da menor para a maior. A menor observação da lista 
é então definida como o [100(í — 0,5)/n]° percentil da amostra. 


Uma vez calculados os valores percentuais de 100(i — 0,5)/n (i = 1, 2 n), os percentis da amostra cor- 

respondentes aos percentuais intermediários são obtidos por interpolação linear. Por exemplo: se n = 10, os per- 
centuais correspondentes às observações ordenadas serão 100(1 - 0,5)/10 = 5%, 100(2 - 0,5)/10 = 15%, 

25% e 100(10 — 0,5)/10 = 95%. O 10“ percentil estará a meio caminho entre o 5“ (menor observação da 

amostra) e o 15“ percentil (segunda menor observação da amostra). Para os nossos propósitos, tal interpolação 
não será necessária porque o gráfico de probabilidade se baseará somente nos percentuais 100 (í — 0,5 )/n corres- 
pondentes às n observações da amostra. 

Um Gráfico de Probabilidade 

Suponha agora que para os percentuais 1000 — 0,5)/n (i = 1,..., n) os percentis sejam determinados para uma 
distribuição de população específica cuja plausibilidade está sendo investigada. Se a amostra foi realmente sele- 
cionada na distribuição especificada, os percentis da amostra (observações ordenadas da amostra) devem estar 
relativamente perto dos percentis correspondentes da distribuição da população. Isso é, para i = 1 , 2 ,..., n deve 
haver concordância razoável entre a /-ésima menor observação da amostra e o [ 1 00( / — 0,5)/n]ésimo percentil 
da distribuição especificada. Considere os pares (percentil da população, percentil da amostra), isso é, os pares 

/[lOOó - 0,5)/n]ésimo percentil i-ésima menor observação \ 

\ da distribuição ’ da amostra / 

para i = 1,..., n. Cada par desse tipo é locado como um ponto em um sistema de coordenadas bidimensional. Se 
os percentis da amostra estiverem próximos aos percentis correspondentes da distribuição da população, o 
primeiro número de cada par será aproximadamente igual ao segundo. Os pontos do gráfico estão próximos a 
uma reta de 45°. Desvios substanciais dos pontos plotados em relação à reta de 45° geram dúvidas sobre a 
hipótese de a distribuição considerada ser a correta. 

Exemplo 4.28 

O valor de uma constante física é conhecido de um experimentador. Ele executa n = 10 medidas independentes 
desse valor, usando certo dispositivo de medida, e registra os erros de medida resultantes (erro = valor obser- 
vado — valor real). Essas observações são exibidas na tabela a seguir. 


Percentagem 

5 

15 

25 

35 

45 

percentil z 

-1,645 

-1,037 

-0,675 

-0,385 

-0,126 

Observação da amostra 

-1,91 

-1,25 

-0,75 

-0,53 

0,20 

Percentagem 

55 

65 

75 

85 

95 

percentil z 

0,126 

0,385 

0,675 

1,037 

1,645 

Observação da amostra 

0.35 

0,72 

0,87 

1,40 

1,56 


É plausível que a variável aleatória erro de medida tenha uma distribuição normal padrão? Os percentis (z) 
normais padronizados necessários também são exibidos na tabela. Portanto, os pontos no gráfico de probabili- 
dade são (-1,645; -1,91), (-1,037; -1,25), ... e (1,645; 1,56). A Figura 4.31 (página 191) mostra o gráfico re- 
sultante. Apesar de os pontos se desviarem um pouco da reta de 45°, a impressão predominante é que a reta 
ajusta muito bem os pontos. O gráfico sugere que a distribuição normal padrão seja um modelo probabilístico 
razoável para o erro de medida. 
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Valor 

observado 



reta de 45° 


percentil z 


Figura 4.31 


Gráfico de pares (percentil z, valor observado) dos dados do Exemplo 4.28: primeira amostra 


A Figura 4.32 mostra um gráfico de pares (percentil z, observação) de uma segunda amostra de 10 obser- 
vações. A reta de 45° fornece bom ajuste para a parte do meio da amostra, mas não para os extremos. O gráfico 
tem uma aparência bem-definida de formato S. 



Figura 4.32 Gráfico de pares (percentil z, valor observado) dos dados do Exemplo 4.28: segunda amostra 

As duas menores observações da amostra são consideravelmente maiores que os percentis z correspon- 
dentes (os pontos na extremidade esquerda do gráfico estão muito acima da reta de 45°). De forma similar, as 
duas maiores observações são muito menores do que os percentis z associados. Esse gráfico indica que a dis- 
tribuição normal padronizada não seria uma escolha plausível para o modelo de probabilidade que propiciou o 
aparecimento desses erros de medida observados. ■ 

Normalmente um investigador não está interessado em saber apenas se uma distribuição probabilística es- 
pecificada, tal como a distribuição normal padrão (normal com fi = 0 e a = l)oua distribuição exponencial 
com À = 0,1, é um modelo plausível para a distribuição da população da qual a amostra foi selecionada. Em vez 
disso, o investigador vai querer saber se algum membro de uma família de distribuições de probabilidade 
especifica um modelo plausível — a família de distribuições normais, a família de distribuições exponen- 
ciais, a família de distribuições de Weibull e assim por diante. Os valores dos parâmetros de uma distribuição 
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normalmente não são especificados de início. Se a família de distribuições de Weibull for considerada como 
modelo para os dados de vida útil, a questão será se há quaisquer valores dos parâmetros a e /3 para os quais a 
distribuição de Weibull correspondentes fornece bom ajuste dos dados. Felizmente, quase sempre ocorre de ape- 
nas um gráfico de probabilidade ser suficiente para avaliar a plausibilidade de uma família. Se o gráfico se 
desviar demais de uma reta. nenhum membro da família pode ser usado. Quando o gráfico é bastante reto, é 
exigido mais trabalho para estimar os valores dos parâmetros (por exemplo, encontrar valores para /jl e cr) que 
forneçam a melhor distribuição para o tipo especificado. 

Enfoquemos a verificação de normalidade de um gráfico. Esse gráfico pode ser bastante útil no trabalho 
aplicado porque diversos processos estatísticos formais são apropriados (fornecem inferências precisas) apenas 
quando a distribuição da população é pelo menos aproximadamente normal. Tais procedimentos normalmente 
não devem ser usados se o gráfico de probabilidade normal mostrar um desvio muito pronunciado da lineari- 
dade. A chave para se construir um gráfico de probabilidade normal abrangente é a relação entre os percentis ( z ) 
normais padronizados e os de outra distribuição: 

percentil de uma distribuição = + a . ( til , corresp ondente) 

(fi, a) normal 

Considere primeiro o caso n - 0. Então, se cada observação for exatamente igual ao percentil normal cor- 
respondente para um valor particular de a, os pares (cr • [percentil z], observação) estarão sobre uma reta de 45°, 
que tem coeficiente angular 1. Tal fato implica que os pares (percentil z, observação) localizam-se em uma reta 
que passa por (0, 0) (isto é, com intercepto y em 0) mas com coeficiente angular cr em vez de 1 . O efeito de um 
valor de /x diferente de zero é simplesmente mudar o intercepto y de 0 para /x. 


Um gráfico dos n pares 

([100(i - 0,5)/n]ésimo percentil z, í-ésima menor observação) 

em um sistema de coordenadas bidimensional é denominado gráfico de probabilidade normal. Se as 
observações da amostra forem de fato obtidas a partir de uma distribuição normal com valor da média /x 
e desvio padrão cr, os pontos devem estar próximos de uma linha reta com coeficiente angular cr e 
cruzando o eixo em /x. Portanto, um gráfico em que os pontos estão próximos a uma linha reta sugere que 
a suposição de uma distribuição de população normal é plausível. 


Exemplo 4.29 

A amostra a seguir, formada por n = 20 observações sobre a voltagem de corte dielétrica de uma resina epóxi 
foi exibida no artigo “Maximum Likelihood Estimation in the 3-Parameter Weibull Distribution ( IEEE Trans. on 
Dielectrics and Elec. Insul., 1996, p. 43-55). Os valores de (i — 0,5)//? para os quais os percentis z são obri- 
gatórios são (1 - 0,5)/20 = 0,025, (2 - 0,5)/20 = 0,075 e 0,975. 


Observação 

24,46 

25,61 

26,25 

26,42 

26,66 

27,15 

27,31 

27.54 

27,74 

27,94 

Percentil z 

-1,96 

-1,44 

-1,15 

-0,93 

-0,76 

-0.60 

-0,45 

-0,32 

-0,19 

-0,06 

Observação 

27,98 

28,04 

28,28 

28,49 

28,50 

28,87 

29,11 

29,13 

29,50 

30.88 

Percentil z 

0.06 

0,19 

0,32 

0,45 

0,60 

0,76 

0,93 

1,15 

1,44 

1,96 


A Figura 4.33 mostra o gráfico de probabilidade normal resultante. O padrão no gráfico é bastante reto, in- 
dicando que é plausível a distribuição da população de voltagens de corte dielétrica ser normal. 
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Voltagem 



Figura 4.33 Gráfico de probabilidade normal da amostra de voltagem de dielétrica de corte ■ 

Há uma versão alternativa do gráfico de probabilidade normal em que o eixo dos percentis z é substituído 
por um eixo de probabilidade não-linear. A escala dos eixos é construída de forma que os pontos devem nova- 
mente estar próximos a uma reta quando a distribuição da amostra for normal. A Figura 4.34 a seguir mostra um 
gráfico do tipo em MINITAB, para os dados de voltagem de corte do Exemplo 4.29. 

Uma distribuição de população não-normal freqüentemente pode se enquadrar em uma das três categorias 
a seguir: 

1. É simétrica e tem “caudas mais curtas” do que uma distribuição normal, isto é, a curva de densidade de- 
cresce mais rapidamente nas caudas do que a curva normal. 

2. É simétrica e com cauda longa, em comparação à da distribuição normal. 

3. É inclinada. 

Uma distribuição uniforme tem cauda curta, visto que sua função de densidade decresce a zero fora de um 
intervalo finito. A função de densidade f(x) = \I[tt( 1 + x 2 )] para -oo < x < & é um exemplo de distribuição de 
cauda longa, pois 1/(1 + x 2 ) decresce muito menos rapidamente que e~* íf2 . As distribuições lognormal e 
de Weibull estão entre as que possuem inclinação. Quando os pontos em um gráfico de probabilidade normal 
não tendem para a reta, o padrão freqüentemente sugere que a distribuição da população esteja em uma dessas 
três categorias. 



Figura 4.34 Gráfico de probabilidade normal dos dados de voltagem de corte em MINITAB 
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Quando a distribuição da qual a amostra foi selecionada for de cauda curta, a menor e a maior observações 
normalmente não serão tão extremas quanto seria esperado de uma amostra aleatória normal. Visualize uma reta 
desenhada no centro do gráfico: os pontos na extrema direita tendem a estar abaixo da reta (valor observado < 
percentil z), enquanto os pontos na extrema esquerda do gráfico tendem a estar acima da reta (valor observado 
> percentil z). O resultado é um padrão em forma de S, como na Figura 4.32. 

Uma amostra de distribuição de cauda longa também tende a produzir um gráfico com formato de S. En- 
tretanto, em contraste com o caso da distribuição de cauda curta, a extremidade esquerda do gráfico se curva para 
baixo (observado < percentil z), conforme mostrado na Figura 4.35(a) a seguir. Se a distribuição subjacente tiver 
inclinação positiva (uma cauda curta à esquerda e uma cauda longa à direita), as menores observações amostrais 
serão maiores que as esperadas de uma amostra normal, acontecendo o mesmo com as maiores observações. 
Nesse caso, os pontos em ambas as extremidades do gráfico estarão acima de uma reta que passa pela parte cen- 
tral, resultando um padrão curvo, conforme ilustrado na Figura 4.35(b). Uma amostra de distribuição lognormal 
geralmente produz tal padrão. Um gráfico de pares (percentil z, ln(x)) deve então ter a aparência de uma reta. 

Mesmo quando a distribuição da população é normal, os percentis da amostra não coincidirão exatamente 
com os percentis teóricos por causa da variabilidade da amostragem. Quanto os pontos do gráfico de probabili- 
dade podem se desviar do padrão da reta antes que a hipótese de normalidade da população não seja mais 
plausível? A resposta a essa questão não é fácil. Grosso modo , uma pequena amostra de distribuição normal tem 
maior probabilidade de gerar um gráfico com padrão não-linear do que uma amostra grande. O livro Fitting 
Equations to Data (veja a bibliografia do Capítulo 13) apresenta os resultados de um estudo de simulação em 
que diversas amostras de diferentes tamanhos foram selecionadas de distribuições normais. 


Observação 



Observação 


Percentil z 




Percentil z 


Figura 4.35 Gráficos de probabilidade que sugerem distribuição nâo-normal: (a) um gráfico consistente 
com distribuição de cauda longa; (b) um gráfico consistente com distribuição de inclinação positiva 


Os autores concluíram que normalmente há maior variação na aparência do gráfico de probabilidade para 
tamanhos de amostra inferiores a 30 e o padrão linear geralmente predomina apenas para tamanhos de amostras 
muito maiores. Quando um gráfico baseia-se em uma amostra de tamanho pequeno, apenas um desvio muito 
substancial pode ser usado como evidência conclusiva de não-normalidade. Comentário similar se aplica a grá- 
ficos de probabilidade para verificação de plausibilidade de outros tipos de distribuições. 


Além da Normalidade 

Considere uma família de distribuições de probabilidade envolvendo dois parâmetros, 0, e 0 2 , e represente 
por F(x\ 0,, 6 2 ) as fdcs correspondentes. A família de distribuições normais é uma delas, com 0, = fi, 0, = o, e 
F(x\ ix, cr) = d>[(x - ii)/a]. Outro exemplo é a família de Weibull, com 0, = a,d 2 = j 3, e 


F(x\ a, 0) = 1 — e-«w 
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Outra família desse tipo é a família gama, para a qual a fdc é uma integral que envolve a função gama in- 
completa que não pode ser expressa de nenhuma forma mais simples. 

Os parâmetros 0, e 0 2 são denominados parâmetros de localização e parâmetros de escala, respectivamente, 
se F(x\ 0„ 0 2 ) for uma função de U — 0,)/0 ; . Os parâmetros geada família normal são parâmetros de loca- 
lização e parâmetros de escala, respectivamente. A alteração de p. desloca a localização da curva de densidade 
em formato de sino para a direita ou para a esquerda, e a alteração de <r amplia ou comprime a escala de medida 
(a escala do eixo horizontal quando a função densidade for plotada). Outro exemplo é dado pela fdc 

F(x\ 0„ 0 2 ) = 1 - -« < x < * 

Diz-se que uma variável aleatória com essa fdc possui distribuição de valor extremo. É usada em aplicações 
que envolvem a vida útil de componente e a resistência do material. 

Apesar de a fdc do valor extremo sugerir à primeira vista que 0, é o ponto de simetria da função de densi- 
dade e, portanto, ser a média e a mediana, esse não é o caso. Pelo contrário, P(X ^ 0,) = F(0,; 0,, 0 2 ) = 1 — 
e ' 1 = 0,632, e a função de densidade /( jt; 0,, 0 2 ) = F'(x; 0,, 0 2 ) tem inclinação negativa (cauda longa mais baixa). 
De forma similar, o parâmetro da escala 0 2 não é o desvio padrão (/i. = 0, — O,57720 2 e cr = 1,2830 2 ). Entretanto, 
a mudança do valor de 0, altera a localização da curva de densidade, enquanto a alteração de 0 2 redefine o eixo 
de medidas. 

O parâmetro /3 da distribuição de Weibull é um parâmetro de escala, mas a não é de localização. O 
parâmetro a normalmente é mencionado como parâmetro de formato. Um comentário similar se aplica aos 
parâmetros a e /? da distribuição gama. Na forma usual, a função de densidade de qualquer membro da dis- 
tribuição gama ou de Weibull é positiva para x =» 0 e zero em caso contrário. Um parâmetro de localização pode 
ser introduzido como um terceiro parâmetro y (fizemos isso para a distribuição de Weibull) para deslocar a 
função de densidade de forma que seja positiva se jc =s< y e zero em caso contrário. 

Quando a família em consideração possui apenas parâmetros de escala e de localização, a questão de al- 
gum membro da família ser ou não uma distribuição de população plausível pode ser resolvida por meio de um 
único gráfico de probabilidade de fácil construção. Primeiro são obtidos os percentis da distribuição-padrão, 
aquela com 0, = 0 e 0 2 = 1, para porcentagens 100(< - 0,5)/n (i = 1,..., n). Os n (percentil padronizado, obser- 
vação) pares fornecem os pontos do gráfico. Isso foi exatamente o que fizemos para obter um gráfico de proba- 
bilidade normal abrangente. Surpreendentemente, essa metodologia pode ser aplicada para obtenção de um 
gráfico de probabilidade de Weibull. O resultado-chave é que, se X tiver distribuição de Weibull com parâmetro 
de formato a e parâmetro de escala /3, a variável transformada ln(X) tem uma distribuição de valor extremo com 
parâmetro de localização 0, = ln(/3) e parâmetro de escala a. Assim, um gráfico dos pares (percentil do valor ex- 
tremo padronizado, ln(.r)) que mostre padrão linear forte fornece suporte para a escolha da distribuição Weibull 
como modelo de população. 

Exemplo 4.30 

As observações a seguir são relativas à vida útil (em horas) do isolamento de aparelho elétrico quando a acele- 
ração da tensão térmica e elétrica são mantidas com certos valores (“On the Estimation of Life of Power Appa- 
ratus Insulation Under Combined Electrical and Thermal Stress,” IEEE Trans. on Electrical Insulation, 1985, p. 
70-78). O gráfico de probabilidade de Weibull exige que se calcule primeiro o 5“, 15 fl , ésimo ... e 95 c percentis 
da distribuição de valor extremo padrão. O (100/?)° percentil tj (p) satisfaz 

P = F( V (p)) = 1 - e-** 

de onde rj(p) = ln[ — ln(l - p)\. 


Percentil 


-2,97 

-1,82 

-1,25 

-0.84 

-0,51 


X 


282 

501 

741 

851 

1072 


ln( x) 


5,64 

6,22 

6,61 

6,75 

6,98 


Percentil 


-0.23 

0,05 

0,33 

0,64 

1,10 


X 


1122 

1202 

1585 

1905 

2138 


ln(x) 


7.02 

7,09 

7,37 

7,55 

7,67 
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Os pares (-2,97, 5,64), (-1,82, 6,22),..., (1,10, 7,67) estão plotados como pontos na Figura 4.36. A dis- 
posição dos pontos em reta é uma forte evidência de que se deve usar a distribuição de Weibull como modelo da 
vida útil do isolamento, conclusão a que o autor do artigo citado também chegou. 


ln(x) 
8 - 




J I I I I L 


Percentil 


-3 - 2-10 1 

Figura 4.36 Gráfico de probabilidade de Weibull dos dados de vida útil do isolamento 


A distribuição gama é um exemplo de uma família que envolve um parâmetro de formato para o qual não 
há transformação /i(-), tal que h(X) tenha distribuição que depende apenas dos parâmetros de localização e es- 
cala. A construção de um gráfico de probabilidade requer primeiro a estimativa do parâmetro de formato pelos 
dados da amostra (alguns métodos de processamento são descritos no Capítulo 6). Às vezes, um investigador 
quer saber se a variável transformada X 8 tem distribuição normal para algum valor de 6 (por convenção, 9 = 0 é 
identificado com a transformação logarítmica, caso em que X possui distribuição lognormal). O livro Graphical 
Methodsfor Data Analysis, relacionado na bibliografia do Capítulo 1, aborda esse tipo de problema, bem como 
outras discussões dos gráficos de probabilidade. 


Exercícios | Seção 4.6 (81-91) 


81. O gráfico de probabilidade normal a seguir foi cons- 
truído a partir de uma amostra de 30 leituras de tensão 
na malha de pontos de tubos de vídeo usados em moni- 
tores de computadores. Parece plausível que a dis- 
tribuição da tensão seja normal? 


Tensão 



82. Considere as 10 observações a seguir de vida útil de 
mancais (em horas): 

152.7 172,0 172,5 173,3 193,0 

204.7 216,5 234,9 262,6 422,6 



83. Construa um gráfico de probabilidade normal para a 
seguinte amostra de observações relativas à espessura 
da cobertura de tintas de baixa viscosidade (“Achieving 
a Target Value for a Manufacturing Process: A Case 
Study”, J. of Quality Technology , 1992, p. 22-26). Você 
se sentiria confortável ao estimar a média da espessura 
da população usando um método que assume uma dis- 
tribuição de população normal? 

0,83 0,88 0,88 1,04 1,09 1,12 1,29 1,31 

1,48 1,49 1,59 1,62 1,65 1,71 1,76 1,83 


84. O artigo “A Probabilistic Model of Fracture in Concrete 
and Size Effects on Fracture Toughness” {Magazine of 
Concrete Res., 1996, p. 311-320) fornece argumentos 
que explicam por que a distribuição de dureza de fratura 
em corpos de prova de concreto tem uma distribuição de 
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Weibull, além de apresentar diversos histogramas de da- 
dos que parecem ajustados com curvas de Weibull super- 
postas. Considere a seguinte amostra de tamanho n = 18 
observações de dureza de concreto de alta resistência 
(consistente com um dos histogramas). Os valores de 
Pi = (/' - 0,5)/18 também são fornecidos. 

Observação 0,47 0,58 0,65 0,69 0,72 0,74 

p 0,0278 0,0833 0,1389 0,1944 0,2500 0,3056 

Observação 0,77 0,79 0,80 0,81 0,82 0,84 

p , 0,3611 0,4167 0,4722 0,5278 0,5833 ,6389 

Observação 0,86 0,89 0,91 0,95 1,01 1,04 

p 0,6944 0,7500 0,8056 0,8611 ,09167 0,9722 

Construa um gráfico de probabilidade de Weibull 
e comente. 

85, Construa um gráfico de probabilidade normal para os 
dados de propagação de trincas por fadiga do Exercício 
39 (Capítulo 1). Parece plausível que a vida da propa- 
gação tenha distribuição normal? Explique. 

86. 0 artigo “The Load-Life Relationship for M50 Bea- 
rings with Silicon Nitride Ceramic Balis'’ ( Lubrication 
Engr., 1984, p. 153-159) relata os dados a seguir sobre 
a vida de carga de mancais (milhões revs.) para mancais 
testados com cargas de 6,45 kN. 

47,1 68,1 68,1 90,8 103,6 106,0 115,0 

126.0 146,6 229,0 240,0 240,0 278,0 278,0 

289.0 289,0 367,0 385,9 392,0 505,0 

a. Construa um gráfico de probabilidade normal. A 
normalidade é plausível? 

b. Construa um gráfico de probabilidade de Weibull. A 
família de distribuições Weibull é plausível? 

87. Construa um gráfico de probabilidade que permita 
avaliar a normalidade da distribuição lognormal como 
um modelo para os dados de precipitação do Exercício 

81 (Capítulo 1). 

88. As observações a seguir são valores de precipitação no 
mês de março de um período de 30 anos em Minneapo- 

lis-St. Paul. 


0,77 

1,20 

3,00 

1,62 

2,81 

2,48 

1,74 

0,47 

3,09 

1,31 

1,87 

0.96 

0,81 

1,43 

1,51 

0,32 

1,18 

1.89 

1,20 

3,37 

2,10 

0,59 

1,35 

0,90 

1,95 

2,20 

0.52 

0,81 

4,75 

2,05 


a. Construa e interprete um gráfico de distribuição nor- 
mal para o conjunto de dados. 

b. Calcule a raiz quadrada de cada valor e então cons- 
trua um gráfico de probabilidade normal com base 
nos dados transformados. Parece plausível que a 
raiz quadrada da precipitação tenha distribui- 
ção normal? 

c. Repita a parte (b) após transformar por raízes 
cúbicas. 

89. Use um software estatístico para construir um gráfico 
de probabilidade normal dos dados do limite de re- 
sistência à tração fornecidos no Exercício 13 do Capí- 
tulo 1 e comente. 

90. Sejam as observações ordenadas da amostra y h y 2 ,..., y„ 
(y, sendo o menor e y„ o maior). Sugerimos, para veri- 
ficação de normalidade, que os pares (d> *((/ - 0,5)/w), 
y,) sejam plotados. Suponha que acreditemos que as 
observações são provenientes de uma distribuição com 
média 0 e assuma w,,..., w n como os valores absolutos 
ordenados dos jc,s. Um gráfico seminormal é um grá- 
fico de probabilidade dos w,s. Mais especificamen- 
te, como P ( | Z | < w) = P(—w < Z < w) = 2<t>(w) — 1, 
um gráfico seminormal é um gráfico dos pares 
(d> _, ((í - 0,5 )/n) + l)/2, >v,). A virtude desse gráfico é 
que os pequenos ou grandes outliers na amostra origi- 
nal serão exibidos apenas na extremidade superior e 
não nas duas extremidades. Construa um gráfico semi- 
normal para a seguinte amostra de erros de medida e 
comente: -3,78, -1,27, 1,44, -0,39, 12,38, -43,40, 
1,15, -3,96, -2,34, 30,84. 

91. As seguintes observações de tempos de falha (milhares 
de horas) são resultantes de testes de vida aceleradas de 
1 6 chipes de certo tipo de circuito integrado: 

82,8 11,6 359,5 502,5 307,8 179,7 

242,0 26,5 244,8 304,3 379,1 212,6 

229,9 558,9 366,7 204,6 

Use os percentis correspondentes da distribuição expo- 
nencial com À = 1 para construir um gráfico de pro- 
babilidade. Explique, então, por que o gráfico avalia a 
plausibilidade da amostra gerada a partir de qualquer 
distribuição exponencial. 


Exercícios Suplementares (92-120) 


92. Seja X = tempo que leva para uma cabeça de 
leitura/gravação encontrar um registro específico em 
uma memória em disco de um computador, após ter 
sido posicionada sobre a faixa correta. Se os discos 
executarem uma rotação em cada 25 milisegundos, uma 
hipótese razoável é que X seja distribuído uniforme- 
mente no intervalo [0, 251. 


a. Calcule P( 10 < X < 20). 

b. Calcule P(X> 10). 

c. Deduza a fdc F(X). 

d. Calcule E(X) e <r x . 

Uma barra de 12 pol. fixa nas duas extremidades será 
submetida a uma tensão crescente até sua ruptura. 


174 Probabilidade e Estatística - Editora Thomson 


Seja Y = distância da ruptura da barra em relação à 
extremidade esquerda. Suponha que Y tenha fdp 



0<y < 12 
caso contrário 


Calcule os dados a seguir: 

a. A fdc de K, e faça o gráfico. 

b. P(Y < 4), P(Y > 6), e P(4 < Y < 6) 

c. E(Y\ E(Y 2 ) e V(Y) 

d. A probabilidade de o ponto de ruptura ocorrer a mais 
de 2 pol. do ponto de ruptura esperado. 

e. O comprimento esperado do menor segmento após 
a ruptura. 


94. Seja X o tempo até a falha (em anos) de certo compo- 
nente hidráulico. Suponha que a fdp de X seja f(x) = 
32/(jc + 4) 3 para x > 0. 

a. Demonstre que se f(x) é uma fdp legítima. 

b. Determine a fdc. 

c. Use o resultado da parte (b) para calcular a proba- 
bilidade de o tempo até a falha estar entre 2 e 5 anos. 

d. Qual é o tempo esperado até a falha? 

e. Se o componente tiver valor residual de 100/(4 + jc), 
quando o tempo até a falha for jc, qual será o valor 
residual esperado? 

95. O tempo de conclusão X de uma determinada tarefa 
possui fdc F(jc) dada por 



jc < 0 


0 < jc< 1 



1 — x 


7 

3 


jc > 


]_ 

3 


b. Entre 10 jarras selecionadas aleatoriamente, qual é 
a probabilidade de ao menos oito conterem mais do 
que o conteúdo nominal? 

c. Assumindo que a média permaneça em 137,2, para 
que valor o desvio padrão teria de ser alterado para 
que 95% de todas as jarras contenham mais do que 
o conteúdo nominal? 


98. Quando as placas de circuito usadas na fabricação de 
CD-players são testadas, a porcentagem de peças com 
defeito no longo prazo é 5%. Suponha que um lote de 
250 placas tenha sido recebido e que a condição de uma 
placa é independente das outras. 

a. Qual é a probabilidade aproximada de que ao 
menos 10% das placas do lote tenham defeito? 

b. Qual é a probabilidade aproximada de que exata- 
mente 10 peças tenham defeito no lote? 

99. O artigo “Characterization of Room Temperature 
Damping in Aluminum-Indium Alloys” ( Metallurgical 
Trans ., 1993, p. 161 1-1619) sugere que o tamanho de 
grão de matriz Al (/xm) de uma liga formada por 2% 
de índio pode ser modelado com uma distribuição nor- 
mal de valor médio 96 e desvio padrão 14. 

a. Qual é a probabilidade de o tamanho do grão ex- 
ceder 100? 

b. Qual é a probabilidade de o tamanho do grão estar 
entre 50 e 80? 

c. Que intervalo (a, b) inclui os 90% centrais de todos 
os tamanhos de grãos (de forma que 5% estejam 
abaixo de a e 5% acima de b)2 

100. O tempo de reação (em segundos) a um determinado 
estímulo é uma variável aleatória contínua com fdp 


/(*) = 


3 1 

2 ’ x 2 
0 


1 < jc< 3 
caso contrário 


a. Obtenha a fdp f(x ) e faça o gráfico. 

b. Calcule P( 0,5 < X < 2). 

c. Calcule E(X). 

96. A tensão de ruptura de um determinado tipo de diodo 
escolhido aleatoriamente possui distribuição normal 
com valor de média 40 V e desvio padrão 1 ,5 V. 

a. Qual é a probabilidade de a voltagem de um diodo 
estar entre 39 e 42? 

b. Que valor faz com que apenas 15% dos diodos te- 
nham voltagens que excedam aquele valor? 

c. Se quatro diodos forem selecionados de forma inde- 
pendente, qual será a probabilidade de ao menos um 
ter uma voltagem maior que 42? 

97. O artigo “Computer Assisted Net Weight Control" 
( Quality Progress , 1983, p. 22-25) sugere uma distri- 
buição normal com média 1 37,2 onças e desvio padrão 
1,6 onça para o conteúdo real de um tipo específico de 
jarras. O conteúdo nominal é de 135 onças. 

a. Qual é a probabilidade de uma única jarra conter 
mais do que o conteúdo nominal? 


a. Deduza a fdc. 

b. Qual é a probabilidade de o tempo de reação ser no 
máximo 2,5 segundos? Entre 1,5 e 2,5 segundos? 

c. Calcule o tempo de reação esperado. 

d. Calcule o desvio padrão do tempo de reação. 

e. Se um indivíduo levar mais de 1,5 segundo para 
reagir, uma luz se acende e fica acesa até que mais 
um segundo passe ou até a pessoa reagir (o que 
ocorrer primeiro). Determine o tempo esperado de 
luz acesa. [Sugestão: Seja h{X) = tempo em que a 
luz fica acesa como função do tempo de reação X] 

101. Seja X a temperatura em que uma reação química 

acontece. Suponha que a fdp de X seja 


/(*) = 


0 


-1 < Jt < 2 
caso contrário 


a. Faça o gráfico de j{x). 

b. Determine a fdc e faça o gráfico. 
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c. 0 é a temperatura mediana em que ocorre a reação? 
Caso não seja. essa temperatura mediana é maior 
ou menor que 0? 

d. Suponha que a reação ocorra de forma indepen- 
dente, uma vez em cada um de 10 diferentes labo- 
ratórios e que a fdp do tempo de reação em cada 
laboratório seja fornecida. Seja Y = número entre 
os 10 laboratórios em que a temperatura excede 1. 
Qual é o tipo de distribuição de Y1 (Forneça o nome 
e os valores dos parâmetros.) 

102. 0 artigo “Determination of the MTF of Positive Pho- 
toresists Using the Monte Cario Method” ( Photo - 
graphic Sei . and Engr. , 1983, p. 254-260) propõe uma 
distribuição exponencial com parâmetro À = 0,93 
como modelo de distribuição do comprimento da tra- 
jetória de um fóton (/im) sob determinadas circuns- 
tâncias. Suponha que esse seja o modelo correto. 

a. Qual é o comprimento esperado da trajetória e qual 
é o desvio padrão? 

b. Qual é a probabilidade de o comprimento da tra- 
jetória exceder 3,0? Qual é a probabilidade de o 
comprimento da trajetória estar entre 1 .0 e 3,0? 

c. Que valor é excedido por apenas 10% de todos os 
comprimentos de trajetórias? 

103. 0 artigo “The Prediction of Corrosion by Statistical 
Analysis of Corrosion Profiles” ( Corrosion Science , 
1985, p. 305-315) sugere a fdc a seguir para a profun- 
didade X da cavidade mais profunda do experimento 
que envolve a exposição de aço carbono manganês à 
água do mar acidificada. 

F(x\ a, /3) = £ 7 '~ (jr_aV/3 -oo < ;c < oo 

Os autores propõem os valores a = 150 e p = 90. 
Assuma esse modelo como o correto. 

a. Qual é a probabilidade de a profundidade da cavi- 
dade mais profunda ser no máximo 150? No má- 
ximo 300? Entre 150 e 300? 

b. Abaixo de que valor a profundidade máxima do poço 
pode ser observada em 90% de todos os experimentos? 

c. Qual é a função densidade de X? 

d. A função densidade pode ser mostrada como sendo 
unimodal (um único pico). Acima de que valor do 
eixo das medidas ocorre o pico? (Esse valor é 
a moda.) 

e. Podemos demonstrar que E(X) =* 0,5772/3 + a. 
Qual é a média dos valores fornecidos de a e /3, e 
como ele se compara à mediana e à moda? Desenhe 
o gráfico da função densidade. (Nota: Ela é deno- 
minada distribuição de maior valor extremo.) 

KM. Um componente tem uma vida útil X com distribuição 
exponencial de parâmetro À. 

a. Se o custo operacional por unidade de tempo for c, 
qual será o custo operacional esperado desse com- 
ponente durante sua vida útil? 

b. Em vez de uma taxa de custo constante c como na par- 
te (a), suponha que a taxa de custo seja ti 1 - 0,5^“) 
com a < 0, de forma que o custo por unidade de 


tempo é menor do que c quando o componente é 
novo e fica mais caro à medida que o componente 
envelhece. Calcule agora o custo operacional espe- 
rado durante a vida útil do componente. 

105. A moda de uma distribuição contínua é o valor x* que 
maximiza /(*). 

a. Qual é a moda de uma distribuição normal com 
parâmetros p e cri 

b. A distribuição uniforme com parâmetros Aefl tem 
uma única moda? Por quê? 

c. Qual é a moda de uma distribuição exponencial 
com parâmetro À? (Desenhe uma ilustração.) 

d. Se X possui uma distribuição gama com parâmetros 
/3, e a > 1, determine a moda. [Sugestão: ln[/(jc)] 
será maximizada se, e somente se, f(x) o for, e 
é mais simples obter a derivada de ln[/(jc)].] 

e. Qual é a moda de uma distribuição qui quadrado 
com v graus de liberdade? 

106. O artigo “Error Distribution in Navigation” (7. Insti- 
tute of Navigation , 1971 , p. 429-442) sugere que a dis- 
tribuição de freqüência de erros positivos (magnitudes 
dos erros) é bem aproximada por uma distribuição 
exponencial. Seja X = o erro de posição lateial (mi- 
lhas náuticas), que pode ser negativo ou positivo. 
Suponha que a fdp de X seja 

/( x) = (0, 1 )^-°- 2 UI -oo < jc < oo 

a. Desenhe um gráfico de/(jc) e demonstre que/(jc) é 
uma fdp legítima (mostre que a integral é 1). 

b. Deduza a fdc de X e faça o gráfico. 

c. Calcule P(X < 0), P(X < 2), />(- 1 <X<2)ea 
probabilidade de se cometer um erro de mais de 
2 milhas. 

107. Em alguns sistemas, um cliente é alocado a uma de 
duas instalações. Se o tempo de serviço de um cliente 
servido por uma instalação i tiver uma distribuição 
com parâmetros À, (i = 1, 2) e p for a proporção de to- 
dos os clientes servidos pela instalação 1, a fdp de X = 
tempo de serviço de um cliente selecionado aleatoria- 
mente será 

/(*; À,, À 2 , p) 

pA,e~ A| * + (1 — p)\ 2 e KjX x ^ 0 

0 caso contrário 

Essa distribuição é freqüentemente denominada dis- 
tribuição exponencial mista ou hiperexponencial. Ela 
também é proposta como modelo para quantidade de 
chuva em “Modeling Monsoon Affected Rainfall of 
Pakistan by Point Processes” (/ Water Resources 
Planning and Mgmnt. y 1992, p. 671-688). 

a. Demonstre que /( jc; À,, A 2 , p) realmente é uma fdp. 

b. Qual é a fdc F(x ; A,, À 2 , p)l 

c. Se X tiver /(*; A „ À 2 , p) como sua fdp, qual será £(X)? 

d. Usando o fato de que E(X 2 ) = 2/A 2 quando X pos- 
sui uma distribuição exponencial com parâmetro A, 
calcule E(X 2 ) quando X tiver fdp /(j t; A ,, A 2 , p). De- 
pois, calcule V(X). 
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e. O coeficiente da variação de uma variável aleatória 
(ou distribuição) é CV = oV/x. Qual é o CV para 
uma va exponencial? O que você pode dizer sobre 
o valor CV quando X tem uma distribuição hiper- 
exponencial? 

f. Qual é o CV de uma distribuição de Erlang com 
parâmetros À e n como definido no Exercício 62? 
(Nota: No trabalho aplicado, o CV amostrai é usa- 
do para decidir qual das três distribuições pode 
ser apropriada.) 

108. Suponha que um estado específico permita que os in- 
divíduos preencham restituições de imposto somente 
se o total das deduções em itens ultrapassar valores 
acima de US$ 5000. Seja X (em milhares de dólares) o 
total das deduções em itens de um formulário esco- 
lhido aleatoriamente. Assuma que X tenha fdp 

kJxT x > 5 
0 caso contrário 

a. Determine o valor de k. Que restrição é necessária 
para a? 

b. Qual é a fdc de X? 

c. Qual é a dedução total esperada de um formulário 
escolhido aleatoriamente? Que restrição é neces- 
sária para a tal que E(X) seja finito? 

d. Mostre que ln(X/5) possui uma distribuição expo- 
nencial com parâmetro a — 1 . 

109. Seja por I, a corrente de entrada de um transistor e / 0 a 
corrente de saída. O ganho de corrente então será pro- 
porcional a ln(/ 0 //i). Suponha que a constante de pro- 
porcionalidade seja 1 (que implica a escolha de uma 
unidade de medida específica), de forma que o ganho 
da corrente = X = ln(/ 0 //,). Assuma X como distri- 
buição normal com /z = 1 e cr = 0,05. 

a. Que tipo de distribuição tem a razão / 0 //,? 

b. Qual é a probabilidade de a corrente de saída ser 
maior que o dobro da corrente de entrada? 

c. Qual é o valor esperado e a variância da razão da 
corrente de saída partir a de entrada? 

110. O artigo “Response of SiC f /Si 3 N 4? Composites Under 
Static and Cyclic Loading — An Experimental and 
Statistical Analysis” (J. of Engr. Materials and Tech- 
nology , 1997, p. 186-193) sugere que a resistência à 
tração (MPa) de compostos em condições específicas 
pode ser modelada por uma distribuição de Weibull 
com a = 9 e = 180. 

a. Desenhe o gráfico da função de densidade. 

b. Qual é a probabilidade de a resistência de um es- 
pécime selecionado aleatoriamente exceder 175? 
Estar entre 150 e 175? 

c. Se dois espécimes selecionados aleatoriamente fo- 
rem escolhidos de forma independente, qual será a 
probabilidade de ao menos um ter uma resistência 
entre 150 e 175? 

d. Que valor de resistência separa os 10% mais fracos 
de todos os espécimes dos 90% restantes? 


111. Assuma Z com uma distribuição normal padrão e de- 
fina uma nova va Y como Y = crZ 4 - /x. Mostre que Y 
tem distribuição normal com parâmetros /z e cr. ( Suges- 
tão: K < y se, e somente se, Z ^ ? Use isso para deter- 
minar a fdc de Y e depois diferencie em relação a v.) 

112. a. Suponha que a vida útil X de um componente, 

quando medido em horas, tenha uma distribuição 
gama com parâmetros a e p. Seja Y = vida útil me- 
dida em minutos. Deduza a fdp de Y. ( Sugestão : 
Y < y se e somente X < yl 60. Use isso para obter a 
fdc de Y e depois diferencie para obter a fdp.) 
b. Se X tem distribuição gama com parâmetros 
aej 3, qual é a distribuição probabilidade Y = cX? 

113. Nos Exercícios 1 1 1 e 1 12, bem como em muitas outras 
situações, temos a fdp f(x) de X e queremos saber a fdp 
de Y = h(X). Assuma que /*(•) é uma função inver- 
sível, de forma que y = h(x) pode ser resolvida parar 
para se obter x = k(y). Podemos então mostrar que a 
fdp de Yé 

g(y) =/[%)]• U'00l 

a. Se X tiver distribuição uniforme com A = 0 e 
B = 1, encontre a fdp de Y = -ln(X). 

b. Resolva o Exercício 1 1 1 usando esse resultado. 

c. Resolva o Exercício 1 12 (b) usando esse resultado. 

114. Com base nos dados de um experimento de lançamento 
de dardos, o artigo “Shooting Darts” ( Chance , Summer, 
1997, p. 16-19) propôs que os erros horizontais e verti- 
cais em relação a um alvo pontual devem ser indepen- 
dentes um do outro, cada um com distribuição normal 
de média 0 e variância cr. Podemos mostrar então que 
a fdp da distância V do alvo até o ponto de toque é 

/(v) = ^7 • e- vW V > 0 

a. Essa fdp é membro de que família apresentada I 
neste capítulo? 

b. Se a = 20mm (próximo ao valor sugerido no ar- 
tigo), qual é a probabilidade de um dardo ser acer- 
tado dentro de 25mm (cerca de 1 pol.) do alvo? 

115. O artigo “Three Sisters Give Birth on the Same Day” 

( Chance , Spring 2001, p. 23-25) usou o fato de três ir- 
mãs de Utah darem à luz em 1 1 de março de 1998 
como base de proposta de algumas questões interes- 
santes relativas a coincidências de nascimento. 

a. Desconsiderando anos bissextos e assumindo que 
os outros 365 dias são igualmente prováveis, qual é 
a probabilidade de que três nascimentos seleciona- 
dos aleatoriamente ocorram todos em 1 1 de março? 
Indique quaisquer hipóteses existentes, se houver. 

b. Com as hipóteses usadas na parte (a), qual é a pro- 
babilidade de três nascimentos selecionados aleato- 
riamente ocorrerem no mesmo dia? 

c. O autor sugeriu que, com base em extensos dados, 
a duração da gestação (tempo entre a concepção e 
o nascimento) pode ser modelada como tendo 
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distribuição normal com valor médio 280 dias e 
desvio padrão 19,88 dias. As datas-limite para as 
três irmãs de Utah eram 15 de março, I o de abril e 
4 de abril, respectivamente. Supondo que o prazo 
esteja na média da distribuição, qual é a probabili- 
dade de todos os nascimentos ocorrerem em 1 1 de 
março? ( Sugestão : O desvio em relação à data de 
nascimento tem distribuição normal com média 0.) 
d. Explique como você usaria as informações da parte 
(c) para calcular a probabilidade de uma data de 
nascimento comum. 


116. Seja X a vida útil de um componente, com/(x) e F(x) 
sendo a fdp e a fdc de X. A probabilidade de o compo- 
nente apresentar falha no intervalo (x, x 4- Ax) é 
aproximadamente /(x) • Ax. A probabilidade condi- 
cional de o componente apresentar falha em (x, x + 
Ajc), dado que durou ao menos x, é /(x) • Ax/[ 1 - 
F(x)]. Dividindo a expressão por Ax produz a função 
de taxa de falha: 


Kx) = 


Ax) 

1 - F(x) 


Um aumento da função de taxa de falha indica que 
os componentes mais antigos têm mais probabilidade 
de apresentar desgaste, enquanto uma taxa de falha 
decrescente é evidência de aumento de confiabilidade 
com a idade. Na prática, uma falha “com formato de 
banheira" é assumida com freqüência. 

a. Se X tiver distribuição exponencial, qual será r(x)? 

b. Se X tiver distribuição de Weibull com parâmetros 
aejS, qual será r(x)? Para que valores de parâme- 
tros r(x ) aumentará? Para que valores de pa- 
râmetros r(x) diminuirá com x? 

c. Como r(*) = -(dJdx) ln[l — F(x)], ln[l — F(x)] = -J 
r(jc) dx. Suponha 



0<x</3 
caso contrário 


de forma que. se um componente durar / 3 horas, durará 
para sempre (apesar de não parecer razoável, o modelo 
é usado para estudar apenas o “desgaste inicial"). 
Quais são a fdc e a fdp de X? 

117. Assuma U como tendo uma distribuição uniforme no 
intervalo [0, 1]. Os valores observados com essa dis- 
tribuição podem ser obtidos com um gerador de 
números aleatórios. SejaX = — ( 1/A )ln(l - U). 

a. Mostre que X possui uma distribuição exponencial 
com parâmetro A. [Sugestão: a fdc de X é F(x) = 
P(X < x); X < x é equivalente a f/ < ?] 

b. Como você usaria a parte (a) e um gerador de 
números aleatórios para obter valores observados 
de uma distribuição exponencial com parâmetro 
A = 10? 

118. Considere uma va X com média /i e desvio padrão a e 
seja g(X) uma função especificada de X. A série de 


aproximação de Taylor de primeira ordem em relação 
a g(X) na vizinhança de /jl é 

g(X) » g(n) + g\ii) • (X - fi) 

O lado direito dessa equação é uma função linear de X. 
Se a distribuição de X estiver concentrada em um in- 
tervalo em que g(*) é aproximadamente linear [por 
exemplo, Vx é aproximadamente linear em (1, 2)], a 
equação fornece aproximações para E(g(X)) e V(g(X)). 

a. Forneça expressões para tais aproximações. ( Su- 
gestão : use regras de valor esperado e variância 
para uma função linear aX 4- b.). 

b. Se a voltagem v em um meio for fixa mas a corrente 
/ for aleatória, então a resistência também será uma 
variável aleatória relacionada a / por R = v/7. 
Se /jl, = 20 e a, = 0,5, calcule aproximações para 
M/f e °7r* 

119 . Uma função g(x) é convexa se a corda que conecta 
quaisquer dois pontos no gráfico da função ficar acima 
do gráfico. Quando g(x) é diferenciável, uma condição 
equivalente é que, para cada x, a reta tangente em x es- 
teja totalmente acima ou abaixo do gráfico. (Veja as 
figuras abaixo.) Como g(/i) = g(E(X)) se compara a 
E(g(X))? [Sugestão: a equação da tangente em x =/i é 
y = g(ji) 4 g\/i) • (x - /jl). Use a condição de con- 
vexidade, substitua X por x e calcule os valores 
esperados. Nota: a menos que g(x) seja linear, a de- 
sigualdade resultante (normalmente denominada desi- 
gualdade de Jensen) é estrita (< em vez de ^). Isso é 
válido para vas contínuas e discretas.] 




120 . Assuma X com distribuição de Weibull de parâmetros 
a = 2 e p. Mostre que Y = 2X 2 /fi 2 possui uma dis- 
tribuição qui quadrado com v = 2. [Sugestão: a fdc de 
Y é P(Y ^ y). Expresse essa probabilidade sob a forma 
P(X < g(y)), usando o fato de que X possui fdc da 
forma da Expressão (4. 12) e diferencie em relação à y 
paia obter a fdp de Y.] 
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Distribuições de 
Probabilidade Conjunta 
e Amostras Aleatórias 


Introdução 

Nos capítulos 3 e 4, estudamos modelos probabilísticos com uma única variável aleatória. 
Muitos problemas de probabilidade e estatística nos conduzem a modelos que envolvem 
diversas variáveis aleatórias simultaneamente. Neste capítulo, discutiremos inicialmente os 
modelos probabilísticos para o comportamento conjunto de diversas variáveis aleatórias, 
enfatizando o caso em que as variáveis são independentes umas das outras. Depois estu- 
daremos os valores esperados das funções de diversas variáveis aleatórias, incluindo co- 
variância e correlação como medida do grau de relação entre duas variáveis. 

As três últimas seções do capítulo consideram funções de n variáveis aleatórias X u X 2 , 
.... X n , enfocando especialmente as médias (X, + • • • + X„)/n. Denominamos as funções 
desse tipo, que são elas mesmas variáveis aleatórias, uma estatística. Resultados da pro- 
babilidade são usados para obtenção de informações sobre a distribuição de uma estatís- 
tica. O resultado principal desse tipo é o Teorema do Limite Central (CLT), a base de vários 
procedimentos inferenciais que envolvem tamanhos de amostras grandes. 


5.1 | Variáveis Aleatórias de 
Distribuição Conjunta 

Há várias situações experimentais em que mais de uma variável aleatória será de interesse do investigador. 
Primeiro consideraremos as distribuições de probabilidade conjunta para duas vas discretas, depois para duas vas 
contínuas e finalmente para mais de duas variáveis. 
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A Função de Massa de Probabilidade Conjunta 
Para Duas Variáveis Aleatórias Discretas 

A função de massa de probabilidade (fmp) de uma única va discreta X especifica quanta massa de probabilidade 
é colocada em cada valor X possível. A fmp conjunta de duas vas discretas Xe f descreve quanta massa de pro- 
babilidade é colocada em cada par de valores possível (x, y). 


DEFINIÇÃO Sejam Xe f duas vas discretas definidas no espaço amostrai S de um experimento. A 
função de massa de probabilidade conjunta p{x, y) é definida para cada par de números 

(*, y) por 

p(x,y) = P(X = xeY = y) 

Seja A qualquer conjunto formado por pares de valores (*, y). A probabilidade P[(X, Y) E 
A] é obtida pela soma da fmp conjunta com os pares de A: 

P[(X, F)EA] = X lp(x,y) 

U, y) e a 

Exemplo 5.1 1 ~ — “4 

Uma grande agência de seguros presta serviços a diversos clientes que compraram uma apólice residencial e 
outra de automóvel da mesma seguradora. Para cada tipo, deve ser especificado um valor dedutível. Para uma 
apólice de automóvel as opções são US$ 100 e US$ 250, enquanto, para uma apólice residencial, as opções são 
0, US$ 100 e US$ 200. Suponha que um indivíduo com os dois referidos tipos seja selecionado aleatoriamente 
nos arquivos da seguradora. Sejam X = valor dedutível na apólice de automóvel e Y = valor dedutível na 
apólice residencial. Os pares (X, Y) possíveis são (100, 0), (100, 100), (100, 200), (250, 0), (250, 100) e (250, 
200); a fmp conjunta especifica a probabilidade associada a cada um desses pares, com qualquer outro par 
de probabilidade zero. Suponha que a fmp conjunta seja dada na tabela de probabilidade conjunta 
a seguir: 


X 


p(x, y) 

0 

100 

200 

v 

100 

0,20 

0,10 

0,20 

A 

250 

0,05 

0,15 

0,30 


Então, p( 100, 100) = P(X = 100 e Y = 100) = P( US$1 00 dedutível nas duas apólices) = 0,10. A proba- 
bilidade P(Y > 100) é calculada pela soma das probabilidades de todos os pares (x, y) para os quais y > 100: 

P(Y> 100) = p(100, 100) + p(250, 100) + p(100, 200) + p(250, 200) 

= 0,75 ■ 


Uma função p(x, y) pode ser usada como fmp conjunta desde que p(x, y)â0 para 

ZXpCx.y) = 1- 

A fmp de apenas uma das variáveis é obtida pela soma de p(x, y) em relação aos valores 
O resultado é denominado fmp marginal porque, quando os valores p(x, y) são exibidos em 
guiar, as somas são apenas totais marginais (linha ou coluna). 



DEFINIÇÃO 


As funções de massa de probabilidade marginais de X e de Y, representadas respectiva- 
mente por pyfx) e pfy), são dadas por 

Px(x) = X p(x, y) Pr(y) = X p(x, y) 
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Assim, para obter a fmp marginal de X calculado, digamos, para x = 100, as probabilidades p( 100, y) são 
somadas para todos os valores possíveis y. Cálculo de cada X possível fornece a fmp marginal de X apenas (sem 
referência a )0. Pelas fmps marginais, podem ser calculadas as probabilidades de eventos que envolvem apenas 
X ou apenas Y. 


Exemplo 5.2 (continuação do Exemplo 5.1) 

Os valores de X possíveis são x = 100 e x = 250. assim o cálculo dos totais de linhas da tabela de probabilidade 
conjunta fornece 

p. v (100) = p(100, 0) + p(100, 100) + p(100, 200) = 0,50 

e 

p*(250) = p(250, 0) + p(250, 100) + p(250, 200) = 0,50 


A fmp marginal de X será então 



x = 100, 250 
caso contrário 


De forma similar, a fmp marginal de Y será obtida pelos totais da coluna como a seguir 


Pr(y ) = 


0,25 
* 0,50 
.0 


y = 0, 100 
y = 200 
caso contrário 


A Função de Densidade de Probabilidade 
Conjunta para Duas Variáveis Aleatórias Contínuas 

A probabilidade de o valor observado de uma va contínua X estar em um conjunto unidimensional A (como um 
intervalo) é obtida integrando-se a fdp f(x) em relação ao conjunto A. De forma similar, a probabilidade de o par 
iX. Y) de vas contínuas estar em um conjunto bidimensional A (como um retângulo) é obtida pela integração de 
uma função denominada função de densidade conjunta. 


DEFINIÇÃO 


Seja X e Y vas contínuas. Então, /( x, y) é a função de densidade de probabilidade con 
junta de X e Y se, para qualquer conjunto bidimensional, A 

P[(X,Y)EA] = j Jf(x, y) dx dy 

A 

Em particular, se A for o retângulo bidimensional {(jt, y): a < jc < c ^ y s d), então 
P[(X, Y)EA] = P(a<X<b,c<Y<d) = ff /(*, y) dy dx 

•'c 


Para /(x, y) ser candidata a uma fdp conjunta, deve satisfazer /(x, y) > 0 e J J /( x, y) dx dy = 1 . Podemos 
imaginar /(.x, y) como especificação de uma superfície de altura /(.x, y) acima do ponto (x, y) em um sistema 
tndimensional. Então P[(X, Y) E A] é o volume abaixo dessa superfície e acima da região A, análogo à área 
abaixo de uma curva no caso unidimensional. Como ilustrado na Figura 5.1. 
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f(x.y) 



Figura 5.1 P[(X, Y) S 4] = volume sob a superfície de densidade acima de A 


Exemplo 5.3 


Um banco opera tanto uma instalação de drive-through como em guichê de atendimento. Em um dia selecionado 
aleatoriamente, assuma X = a proporção de tempo em que a instalação de drive-through está em uso (ao menos 
um cliente está sendo atendido ou esperando para ser atendido) e Y = a proporção de tempo em que o guichê de 
atendimento está em uso. O conjunto de valores possíveis de ( X , >0 é. então, o retângulo D = {(x, y): 0 < x < 1, 
0 < y < 1 }. Suponha que a fdp conjunta de (X, Y) seja dada por 


fU y) = 


j(x + f) 0<JC< l,0<y< 1 


0 


caso contrário 


Para provar que essa fdp é verdadeira, observe que /( x, y) > 0 e 

í j f(x,y)dxdy = í f j (x + y 2 ) dx dy 

n 1 6 r 1 r 1 6 

- * dx dy + I J -fdxdy 
i 5 J o J o 5 

r 1 6 r 1 6 6 6 

= — x dx + I — y 2 dx = — H = 1 

J o 5 Jo 5 7 ' 10 15 

A probabilidade de nenhuma das instalações estar ocupada em mais de um quarto do tempo é 

/ 1 1 \ r f i/4 6 

f\0*XSj.0 srs 7 ) = H j(x + y?)drdy 

= — I I x cir dy + — I y 2 dx dy 

5 J o J o 5 J o J o 

- x-i/4 6 y 3 

H — 

20 3 


x=0 


640 


= 0,0109 


Como acontece com as fmps conjuntas, cada uma das duas funções densidade marginais pode ser calcula 
pela fdp de X e Y. 


DEFINIÇÃO 


As funções de densidade de probabilidade marginais de X e K, representadas respecti- 
vamente por f x (x) e fy(y), são dadas por 


fÁx) = í f(x, y) dy para 

4—-3C 


-oo < x < * 


fAy) = I f(x, y) dx 


para -oc < y < oc 


Distribuições de Probabilidade Conjunta e Amostras Aleatórias - Jay L. Devore 183 


Exemplo 5.4 (continuação do Exemplo 5.3) 

A fdp marginal de X, que fornece a distribuição de probabilidades do tempo ocupado para a instalação de drive- 
through sem referência à janela de atendimento, é 



para 0 < r < 1 e 0 em caso contrário. A fdp marginal de Y é 



0 caso contrário 


Então 



\ r 3 ' 4 37 

= J fr(y) dy = — = 0,4625 

/ •'1/4 80 


No Exemplo 5.3, a região da densidade conjunta positiva era um retângulo, o que tomou o cálculo das fdps 
marginais relativamente fácil. Considere agora um exemplo em que a região de densidade positiva é uma figura 
mais complicada. 


Uma empresa de nozes comercializa latas luxuosas de nozes mistas com amêndoas, castanhas de caju e amen- 
doins. Suponha que o peso líquido de cada lata seja exatamente 1 libra, mas que a contribuição do peso de cada 
tipo de noz seja aleatória. Como os três pesos devem somar 1 , um modelo de probabilidade conjunta para quais- 
quer dois fornece todas as informações necessárias sobre o peso do terceiro tipo. Sejam X = peso das amêndoas 
em uma lata selecionada e Y = peso das castanhas de caju. Então a região de densidade positiva é D = { (jc, y): 
0£x< 1, 0 ^ y < 1, jr + y ^ 1 }, região sombreada ilustrada na Figura 5.2. 


Para qualquer x fixo, f(x, y) aumenta com y; para y fixo,/(.r, y) aumenta com x. A hipótese é apropriada 
porque a palavra luxo implica que a maior parte da lata deve ser formada por amêndoas e castanhas de caju em 
vez de amendoins, de forma que a função de densidade deve ser grande próximo ao limite superior e pequena 
perto da origem. A superfície determinada por f(x, y) tem declive positivo a partir de zero, conforme (*, y) se 

ptancia dos eixos. 

Claramente, f(x, y) > 0. Para demonstrar a segunda condição de uma fdp conjunta, lembre-se de que a 
integral dupla é calculada como integral iterativa, mantendo uma variável fixa (como x na Figura 5.2), 


Exemplo 5.5 




y 


(0,1) 



A' 


( 1 . 0 ) 


X 


Figura 5.2 Região de densidade positiva do Exemplo 5.5 


Agora considere que a fdp conjunta de (X, Y) seja 



24xy 0 < jc ^ 1, 0 < y < 1 , jc + y < 1 


0 caso contrário 
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integrando em relação aos valores da outra variável que estão na reta que passa pelo valor da variável fixa e, 
finalmente, integrando em relação a todos os valores possíveis da variável fixa. Dessa forma, 

{ {_ /(•*. y) ày dx = jj f(x, y) dy dx = £ j ^ 24xy dyj dx 

= JJ' 24.x: {y | ' " } dx = Jj 12jc(1 - x) 2 dx = 1 

Para calcular a probabilidade de dois tipos de nozes formarem juntos no máximo 50% da lata, assuma A = 
{(jc, y) : o < x < 1, 0 < y ^ 1, e x + y < 0,5}, conforme mostrado na Figura 5.3. Então 

P((X, Y) EA) = [ í f(x, y) dx dy = í°" í°' 24 xy dy dx = 0,0625 

J A J J 0 J 0 

A fdp marginal das amêndoas é obtida fixando-se Xemre integrando /( jc, >0 ao longo da linha vertical que 
passa por x: 

~ f l ' 24xy dx = 1 2x( 1 — xf 0 < jc < 1 

o caso contrário 



Pela simetria de/(jt, y) e a região D, a fdp marginal de Fé obtida pela substituição de x e X em // x) 
e Y, respectivamente. 

Variáveis Aleatórias Independentes 

Em muitas situações, as informações sobre o valor observado de uma das duas variáveis X e Y fornecem . 
sobre o valor da outra variável. No Exemplo 5. 1 , a probabilidade marginal de Xem.t= 250 era 0,5, como a pro- 
babilidade de X = 100. Se, entretanto, dissessem-nos que a pessoa selecionada tinha Y = 0, então. X = 100é 
quatro vezes mais provável que X = 250. Portanto, há uma dependência entre as duas variáveis. 

No Capítulo 2, apontamos que uma forma de definir a independência de dois eventos é dizer que A e fisàaj 
independentes, se P(A fl B) = P(A) • P(B). Eis uma definição análoga da independência de duas vas. 


DEFINIÇÃO 


Duas variáveis aleatórias X e Y são independentes se, para cada par de valores x e v. 

p(x, y) = p x (x) • Pr(y) quando X e Y são discretas (5fl 

ou 

f(x, y) = f x (x) ’ fy(y) quando X e Y são contínuas 
Se (5.1) não for satisfeita para todos os (.*, y), então, X e Y são denominadas depende 
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A definição diz que duas variáveis são independentes se sua fmp conjunta ou sua fdp for o produto das duas 
fmps ou fdps marginais. 

Exemplo 5.6 

No caso do seguro dos Exemplos 5.1 e 5.2, 

p(100. 100) = 0,10 * (0,5)(0,25) = p x (100) • p Y ( 100) 

de forma que X e Y não são independentes. A independência de X e Y exige que cada entrada na tabela de pro- 
babilidade conjunta seja o produto das probabilidades marginais da linha e da coluna correspondentes. ■ 

Exemplo 5.7 (continuação do Exemplo 5.5) 

Como /(.v, v) tem a forma de um produto, X e Y podem parecer independentes. Entretanto, apesar de/ x (f) = 
/rü) = tí< /(j, 4 ) = 0 ^ ^ ’ 7 ?» então as variáveis não são de fato independentes. Para serem independentes, 
/(r, y) deve ter a forma g(x) • h(y) e a região de densidade positiva deve ser um retângulo cujos lados são para- 
lelos aos eixos de coordenadas. ■ 


A independência de duas variáveis aleatórias é mais útil quando a descrição do experimento em estudo nos 
diz que X e Y não afetam uma à outra. Então, uma vez especificadas as fdps ou as fmps marginais, a fmp ou a 
fdp conjunta é simplesmente o produto das duas funções marginais. Segue que 


Exemplo 5.8 


P(a<X<b,c<Y<d) = P{a<X<b)-P{c<Y<d) 


Suponha que as vidas úteis de dois componentes sejam independentes uma da outra e que a primeira vida útil, 
tenha distribuição exponencial com parâmetro A„ enquanto a segunda, X 2 , tenha distribuição exponencial 
com parâmetro A 2 . A fdp conjunta será então 


/(•* i.*i) =/*,(*■) ’ /*,(*:) 

A,e _A '*' • À 2 e _A * = A l A 2 e~ Ai *' _A *'* Xi > 0, x 2 > 0 

0 caso contrário 


Sejam A, = 1/1000 e A 2 = 1/1200, de forma que as vidas úteis esperadas sejam de 1000 e 1200 horas, res- 
vamente. A probabilidade de que ambas as vidas úteis sejam de no mínimo 1500 horas é 


P( 1 500 < X,, 1500 < X 2 ) = P( 1500 < X,) • P( 1500 < X 2 ) 

= £-A,<l500) . g- VI 500) 

= (0,2231X0,2865) = 0,0639 ■ 


Mais de Duas Variáveis Aleatórias 

Para modelar 0 comportamento conjunto de mais de duas variáveis aleatórias, estendemos o conceito de dis- 
tribuição conjunta de duas variáveis. 


DEFINIÇÃO 


Se X,, X 2 , . . . , X„ são variáveis aleatórias discretas, a fmp conjunta das variáveis é a função 

P(x „ x 2 x n ) = P(X, = x„ X 2 = x 2 X„ = x „ ) 

Se as variáveis forem contínuas, a fdp conjunta de X, X„ será a função f(x„ x 2 , . . . , 

jc„) de forma que, para qualquer dos n intervalos [a„ b x ], . . . , [a„, b„], 

P(íJ, ^ X, íj„ < X„ </>„)= í . . . í f(x, , . . . ,x n ) dx„ . . . dx> 

J ai J a H 
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Em um experimento binomial, cada tentativa pode resultar em um de somente dois resultados possíveis. 
Considere agora um experimento formado por n tentativas idênticas e independentes, em que cada tentativa pode 
resultar em um dos r resultados possíveis. Seja p, = P( resultado i em qualquer tentativa específica) e defina as 
variáveis aleatórias por X, = o número de tentativas que resultam em i (/ = 1, ... , r). Tal experimento é deno- 
minado experimento multinomial. e a fmp conjunta de X, X r ,é denominada distribuição multinomial. 

Usando um raciocínio de contagem análogo ao usado na demonstração da distribuição binomial, a fmp conjunta 
de X X r pode ser demonstrada 


O caso r = 2 fornece a distribuição binomial, com X, = número de sucessos e X 2 = n — X, = número 
de falhas. 

Exemplo 5.9 

Se o alelo de cada uma das 10 seções da ervilha obtidas de forma independente é determinado e p, = P( AA), 
p 2 = P( Aa), p, = P(aa), X, = número de AAs, X 2 = número de Aas e X 3 = número de aas, então 

10' 

p(x„ x 2 , x 3 ) = - — ; pVP%Pf x, = 0, 1 , . . . e x, + jc 2 + x 3 = 10 

(ac,!)(x 2 !)(ar 3 !) ■ 

Se p | = p 3 = 0,25, p 2 = 0,5, então 

P(X, = 2, X 2 = 5, X, = 3) = p( 2, 5, 3) 


Quando um determinado método é usado para coletar um volume fixo de amostras de rochas de uma região, há 
quatro tipos de rochas resultantes. Represente por X,, X 2 , e X, a proporção por volume dos tipos de rochas 1, 2 
e 3 em uma amostra selecionada aleatoriamente (a proporção da rocha do tipo 4 é 1 — X, — X 2 — X 3 , de forma 
que uma variável X 4 seria redundante). Se a fdp conjunta de X,, X 2 , X, for 


Essa integral iterativa tem valor A^144, portanto, k = 144. A probabilidade de que as rochas dos tipos 1 e 
2 juntas sejam responsáveis por no máximo 50% da amostra é 


P(x x r ) 


(*,!)(*:!) 


W) 


p ] p\ jc, = 0. 1,2,.... com jc, + — + x r — n 


0 


caso contrário 



■ 


Exemplo 5.10 



kx,x 2 ( 1 — x 3 ) 0 s .t, < 1 , 0 < ,r 2 < 1 , 0 < .t, < 1 , .X| + x 2 + ^ 1 

0 caso contrário 


então k será determinado por 







I Osjc.sl para i**!, 2. 3 1 
lí, I . x, +otjSOJ5 1 
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A noção de independência de mais de duas variáveis aleatórias é semelhante à noção de independência de 
mais de dois eventos. 


DEFINIÇÃO 


As variáveis aleatórias X„ X 2 , ... , X„ são independentes se para cada subconjunto A",,, X, . 
.... X,„ das variáveis (cada par, cada trio e assim por diante), a fmp ou fdp conjuntas do 
subconjunto for igual ao produto das fdps ou fmps marginais. 


Assim, se as variáveis forem independentes com n = 4, a fmp ou fdp conjunta de quaisquer duas variáveis 
será o produto das duas marginais e de forma semelhante para quaisquer três e todas as quatro variáveis. O mais 
importante é, depois que soubermos que n variáveis são independentes, saber que a fmp ou fdp conjunta será o 
produto das n marginais. 


Exemplo 5.11 




Se A, X„ representam as vidas úteis de n componentes que operam de forma independente um do outro e cada 

vida útil é distribuída exponencialmente com parâmetro A, então 


/(* i. *2 *n) = (A< **') * (Xe ■**>) (AíTN 

= í À"<r A£t jc, > 0, jt 2 > 0 jc„ > 0 

. 0 caso contrário 

Se esses n componentes formam um sistema que apresentará falha assim que um único componente tiver 
uma falha, a probabilidade de o sistema durar mais do que o tempo t é 

P(X, >t X„>t) = 


Portanto, 

Pftempo de vida do sistema < r) = 1 - e~" A ' para í>0 

que mostra que a vida útil do sistema tem uma distribuição exponencial com parâmetro nA; e o valor esperado 
do tempo de vida do sistema é I/wA. ■ 

Em muitas situações experimentais a serem consideradas neste livro, a independência é uma suposição 
razoável, de forma que especificar a distribuição conjunta se reduz a decidir quais são as distribuições margi- 
nais apropriadas. 

Distribuições Condicionais 

Suponha que X = número de defeitos graves em um novo automóvel selecionado aleatoriamente e Y = número 
de defeitos menores no mesmo carro. Sabendo que o número de defeitos graves no automóvel selecionado é um, 
qual é a probabilidade de o carro ter no máximo três defeitos menores, isto é, qual é P( Y < 3 | X = 1 )? De forma 
semelhante, se X e Y representam as vidas úteis de dois componentes em um sistema e acontece de X = 100, 
qual é a probabilidade de Y & 200 e qual é a vida útil esperada do segundo componente “condicional em re- 
lação” a esse valor de XI 

Questões desse tipo são respondidas pelo estudo das distribuições de probabilidades condicionais. 
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DEFINIÇÃO 


Sejam X e Y duas vas contínuas com fdp conjunta f(x, y) e fdp marginal de X, /*(*). Então, 
para qualquer valor x de X para o qual f x (x) > 0, a função de densidade de probabili- 
dade condicional de Y dado que X = x é 

Ai*(y|*) = T7T' —oo < y < oo 
fÁX) 

Se X e Y forem discretas, substituir as fdps por fmps nesta definição fornecerá a função de 
massa de probabilidade condicional de Y quando X = x. 


Observe que a definição de f Y \x(>' U) corresponde à de P(B \ A), a probabilidade condicional da ocorrência 
de B, dado que A tenha ocorrido. Uma vez que a fdp ou fmp condicional tiver sido determinada, questões do tipo 
propostas no início desta subseção podem ser respondidas pela integração ou pela soma de um conjunto apro- 
priado de valores Y. 


Exemplo 5.12 

Reconsidere a situação dos Exemplos 5.3 e 5.4 que envolvem X = proporção de tempo em que o guichê de au- 
tomóveis de um banco está ocupado e Y = proporção análoga para o guichê de atendimento a pessoas. A fdp 
condicional de Y dado que X = 0,8 é 

fy\Áy 1 0,8) = ^ (0 ’ 8 ' - V) = 1,2(0 ’ 8 + - r) = — (24 + 30/) 0<y<\ 

A(0,8) 1, 2(0, 8) + 0,4 34 y 

A probabilidade de o guichê de pessoas estar ocupado no máximo metade do tempo, dado que X = 0,8. é 

P(Y < 0,5 | X = 0,8) = f "Vru(y 1 0,8) dy = í°' 5 ^-(24 + 30/) dy = 0,390 

Usar a fdp marginal de Y fornece P(K< 0,5) = 0,350. Além disso, E(Y) = 0,6, enquanto a proporção 
esperada de tempo em que o guichê de pessoas está ocupado, dado que X = 0,8 (uma expectativa condicional) é 

E(Y\x = 0,8) = fy -f r ,*<>> 1 0,8) dy = -U’ y(24 + 30/) dy = 0,574 
J-oc 34 ■'o 


Exercícios 


Seção 5.1 (1-21) 


1. Um posto de gasolina tem ilhas de auto-serviço e de 
serviço completo. Em cada ilha, há uma única bomba 
de auto-serviço de gasolina comum com duas man- 
gueiras. Sejam X = número de mangueiras em uso 
na ilha de auto-serviço em ura momento específico e 
Y = número de mangueiras na ilha de serviço completo 
em uso naquele mesmo momento. A fmp de X e Y é 
mostrada na tabela a seguir: 


p(x, y ) 

0 

1 

2 


0 

0,10 

0.04 

0,02 

X 

1 

0,08 

0,20 

0,06 


2 

0,06 

0,14 

0,30 


a. Qual é P(X = 1 e Y= 1)? 

b. Calcule P(X<lef<l). 

c. Descreva o evento {X^O e K^O} e calcule 
sua probabilidade. 

d. Calcule a fmp marginal de X e de Y. Usando p x (x), 
qual é P(X < 1)? 

e. X e Y são vas independentes? Explique. 

2. Quando um automóvel é parado por uma patrulha de 
segurança, os pneus são verificados quanto ao desgaste, 
assim como o alinhamento de cada farol. Seja X o nú- 
mero de faróis que precisam de ajuste e Ko número de 
pneus com defeito. 

a. Se Xe Y são independentes com p x (0) = 0,5,p>(l) = 
0,3, p x ( 2) = 0,2, e p Y (0) = 0,6, Py (l) = 0,1, pM 
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p Y ( 3) = 0,05, p y ( 4) = 0,2, mostre a fmp conjunta de 
(X, Y) em uma tabela de probabilidade conjunta. 

b. Calcule P(X < 1 e Y ^ 1) pela tabela de probabili- 
dade conjunta e verifique se ela é igual ao 
produto P(X< 1 )-P(F< 1). 

c. Qual é P(X 4- Y = 0) (a probabilidade de nenhu- 
ma violação)? 

d. Calcule P(X + Y< 1). 

3. Um determinado mercado tem uma fila de caixa ex- 
pressa e uma fila de caixa superexpressa. Represente 
por X, o número de clientes na fila da caixa expressa em 
um determinado horário do dia e por X 2 o número de 
clientes na fila da caixa superexpressa no mesmo 
horário. Suponha que a fmp conjunta de X, e X 2 seja 
dada na tabela a seguir. 


jc 2 



0 

1 

2 3 


0 

0,08 

0,07 

0,04 0.00 

' 

1 

0.06 

0,15 

0.05 0.04 


x, 2 

0,05 

0.04 . 0,10. 0.06 


3 

4 

0,00 

rovo 

0,03 

0,01 

0.04 0.07 
0,05 0,06 



a. Qual é P(X ] = 1, X 2 = 1), isto é, a probabilidade de 
haver exatamente um cliente em cada fila? 

b. Qual é P(X, = X 2 ), isto é, a probabilidade de os nú- 
meros de clientes nas duas filas serem iguais? 

c. Represente por A o evento de haver no mínimo dois 
clientes a mais em uma fila do que na outra. Ex- 
presse A em termos de X, e X 2 , e calcule a probabili- 
dade desse evento. 

d. Qual é a probabilidade de o número total de clientes 
nas duas filas ser exatamente quatro? E no míni- 
mo quatro ? 


4. Retome à situação descrita no Exercício 3. 

a. Determine a fmp marginal de X, e, depois, calcule o 
número esperado de clientes na fila da caixa expressa. 

b. Determine a fmp marginal de X 2 . 

c. Pela inspeção das probabilidades P(X, = 4), P(X 2 = 
0), e P(X, = 4, X 2 = 0), X, e X 2 são variáveis aleató- 
rias independentes? Explique. 



X 

0 

1 

2 

3 

4 

PÁx) 

0,1 

0,2 

0,3 

0,25 

0.15 


Sessenta por cento de todos os clientes que compram 
essas câmeras também compram uma garantia esten- 
dida. Seja Y o número de compradores que durante essa 
semana adquiriram garantia estendida. 

a. Qual é P(X = 4, Y = 2)? [Sugestão: essa probabili- 
dade é igual a P(Y = 2 1 X = 4) • P(X = 4); imagine 
agora que as quatro compras sejam quatro tentativas 
de um experimento binomial, com sucesso em uma 
tentativa correspondente à aquisição de uma garan- 
tia estendida]. 

b. Calcule P(X = Y). 

c. Determine a fmp conjunta de X e Y e, depois, a fmp 
marginal de Y. 

7. A distribuição de probabilidades conjuntas do número 
X de carros e do número Y de ônibus por ciclo de semá- 
foro em uma conversão à esquerda proposta é exibida 
na tabela de probabilidade conjunta a seguir. 



a. Qual é a probabilidade de haver exatamente um car- 
ro e exatamente um ônibus em um ciclo? 

b. Qual é a probabilidade de haver no máximo um 
carro e no máximo um ônibus em um ciclo? 

c. Qual é a probabilidade de haver exatamente um 
carro em um ciclo? E exatamente um ônibus? 

d. Suponha que uma pista de conversão à esquerda 
tenha capacidade para cinco carros e um ônibus, 
equivalente a três carros. Qual é a probabilidade de 
excesso de fluxo em um ciclo? 

e. X e Y são vas independentes? Explique. 

8. Um armazém tem atualmente 30 componentes de certo 
tipo, dos quais 8 são fornecidos pelo fornecedor 1, 10 
pelo fornecedor 2 e 12 pelo fornecedor 3. Seis deles 
serão aleatoriamente selecionados para uma montagem. 
Seja X = número de componentes selecionados do for- 
necedor 1 , Y = número de componentes selecionados 
do fornecedor 2 e p(x, y ) a fmp conjunta de X e Y. 

a. Qual é p( 3, 2)? [Sugestão: cada amostra de tamanho 
6 tem a mesma probabilidade de ser selecionada. 
Portanto, p( 3, 2) = (número de resultados com X = 
3 e Y = 2)/(número total de resultados). Use a regra 
do produto para contagem a fim de obter o nume- 
rador e o denominador]. 

b. Usando a lógica do item (a), obtenha p(x, y). (Isso 
pode ser visto como uma distribuição hipergeomé- 
trica multivariada - amostragem sem reposição de 
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uma população finita consistindo de mais de duas 
categorias). 

9. Admite-se que cada pneu dianteiro de um determinado 
tipo de veículo deve ter a pressão de 26 psi. Suponha 
que a pressão real em cada pneu seja uma variável 
aleatória X para o pneu direito e Y para o esquerdo, com 
fdp conjunta 

\Kte + y 2 ) 20 < jc < 30, 20 < y < 30 
J ' ' 1 0 caso contrário 

a. Qual é o valor de Kl 

b. Qual é a probabilidade de os dois pneus estarem com 
pressão inferior à ideal? 

c. Qual é a probabilidade de a diferença de pressão de 
ar entre os dois pneus ser no máximo 2 psi? 

d. Determine a distribuição (marginal) da pressão de ar 
só do pneu direito. 

e. X e Y são vas independentes? 

10. Annie e Alvie combinaram de se encontrar entre 17 e 
18 horas para jantar em um restaurante local de comida 
saudável. Seja X = a hora de chegada de Annie ef = a 
de Alvie. Suponha que Xef sejam independentes com 
distribuição uniforme no intervalo [5, 6]. 

a. Qual é a fdp conjunta de X e Y1 

b. Qual é a probabilidade de ambos chegarem entre 
1 7h 1 5 e 17h45? 

c. Se o primeiro a chegar esperar apenas 10 minutos 
antes de ir comer em outro lugar, qual é a probabili- 
dade de eles comerem no restaurante de comida 
saudável? [Sugestão: o evento de interesse é A = 
{(*y):|jr-yl 

11. Dois professores diferentes enviaram suas provas finais 
para tiragem de cópias. Seja X o número de erros tipo- 
gráficos na prova do primeiro professor efo número de 
tais erros para o segundo professor. Suponha que X te- 
nha distribuição de Poisson com parâmetro A, Y tenha 
distribuição de Poisson com parâmetro 6 e que X e Y se- 
jam independentes. 

a. Qual é a fmp conjunta de X e Y? 

b. Qual é a probabilidade de no máximo um erro ser 
cometido em ambos os exames combinados? 

c. Obtenha a expressão geral para a probabilidade de o 
número total de erros nos dois exames ser m (onde m 
é um inteiro não-negativo ). [Sugestão: A - {(jc, y): 
x + y = m] = {(m, 0), (m - 1, 1),..., (1, m - 1), (0, 
m)}. Agora some a fmp conjunta em (jc, y) EA e use 
o teorema binomial, que diz 

£ l m )a k b m - i = (a + b) m 

A=0 V k 

para qualquer a, b.] 

12. Dois componentes de um minicomputador possuem a 
fdp conjunta a seguir para seus tempos de vida útil X e Y. 

f( , _ [xe *"» x > 0 e y > 0 
J 10 caso contrário 


a. Qual é a probabilidade da vida útil X do primeiro 
componente exceder 3? 

b. Quais são as fdps marginais de X e K? Os dois perío- 
dos de vida útil são independentes? Explique. 

c. Qual é a probabilidade de o tempo de vida de pelo 
menos um componente exceder 3? 

13. Você tem duas lâmpadas para uma determinada lumi- 
nária. Seja X = vida útil da primeira lâmpada e Y = vida 
útil da segunda lâmpada (ambas de mil horas). Suponha 
que Xe Y sejam independentes e que cada uma tenha 
distribuição exponencial com parâmetro A = 1 . 

a. Qual é a fdp conjunta de X e Y1 

b. Qual é a probabilidade de cada lâmpada durar no 
máximo 1000 horas íisso é, X < 1 e Y < 1)? 

c. Qual é a probabilidade de a vida útil total das duas 
lâmpadas ser no máximo 2? [Sugestão: desenhe a 
região A = { (jc, y): x ^ 0, y ^ 0, x 4* y ^ 2} antes 
da integração.] 

d. Qual é a probabilidade de a vida útil total estar entre 
1 e2? 

14. Suponha que você tenha 10 lâmpadas, que a vida útil de 
cada uma seja independente das demais e que cada vida 
útil tenha distribuição exponencial com parâmetro A. 

a. Qual é a probabilidade de as 10 lâmpadas falharem 
antes do tempo tl 

b. Qual é a probabilidade de exatamente das 10 lâm- 
padas falharem antes do tempo tl 

c. Suponha que nove lâmpadas tenham vida útil expo- 
nencialmente distribuída com parâmetro A e que a 
lâmpada que sobrou tenha vida útil exponencial- 
mente distribuída com parâmetro 0 (é feita por outro 
fabricante). Qual é a probabilidade de exatamente 
cinco das 10 lâmpadas falharem antes do tempo tl ] 

15. Considere um sistema formado por três componentes, 
conforme ilustração. O sistema continuará funcionando 
desde que o primeiro componente funcione e que o 
componente 2 ou o 3 funcionem também. Represente 
por X,, X : e X 3 os tempos de vida dos componentes 1, 2 
e 3, respectivamente. Suponha que os X,s sejam inde- 
pendentes entre si e que cada X, possua uma dis- 
tribuição exponencial com parâmetro A. 



a. Seja Y = tempo de vida do sistema. Obtenha a 
função de distribuição acumulada de Y e calcule a 
diferença para obter a fdp. [Sugestão: F(y) = P(Y^ 
y); expresse o evento { Y < y } em termos de uniões 
e/ou interseções dos três eventos {X, ^y}, {X : ^ 
y},e{X 3 <y}.] 

b. Calcule a vida útil esperada do sistema. 

16. a. Para /(jc,, jc 2 , jc 3 ), como dado no Exemplo 5.10, cal- 
cule a função de densidade marginal conjunta de 
X, e somente de X, (integrando em jc 2 ). 
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b. Qual é a probabilidade de que as rochas dos tipos 1 
e 3 juntas formem no máximo 50% da amostra? [Su- 
gestão: use o resultado do item (a).] 

c. Calcule a fdp marginal apenas de X,. [Sugestão: use 
o resultado do item (a).] 

17. Um ecologista deseja selecionar um ponto dentro de 
uma região circular de amostragem, de acordo com uma 
distribuição uniforme (na prática, isso poderia ser feito 
selecionando-se primeiro uma direção e, depois, uma 
distância do centro naquela direção). Seja X = coorde- 
nada x do ponto selecionado e Y = coordenada y desse 
ponto. Se o círculo tiver centro em (0, 0) e raio /?, então 
a fdp conjunta de X e Y é 

I — !— jr + v 2 < R 2 
nR 2 

0 caso contrário 

a. Qual é a probabilidade de o ponto selecionado estar 
dentro de R/2 do centro da região circular? [Sz/gcs- 
tão: desenhe a região de densidade positiva D. Já que 
f(x,y) é constante em D. calcular a probabilidade re- 
sume-se em calcular uma área.] 

b. Qual é a probabilidade de X e Y serem diferentes de 
0 no máximo RI 2? 

c. Responda ao item (b) com R/s/l substituindo R/2. 

d. Qual é a fdp marginal de XI De K? X e Y são in- 
dependentes? 

18. Refira-se ao Exercício 1 e responda as seguintes 

perguntas: 


a. Dado que X = 1, determine a fmp condicional de Y, 
isto é, Pr|.v(0 1 1), PHx(l 1 1 ). e Pr |x(2 1 1 ). 

b. Dado que duas mangueiras estão sendo utilizadas 
na ilha de auto-serviço, qual é a fmp condicional do 
número de mangueiras em uso na ilha de servi- 
ço completo? 

c. Use o resultado do item (b) para calcular a probabili- 
dade condicional P(Y < 1 \X = 2). 

d. Dado que duas mangueiras estão sendo utilizadas na 
ilha de serviço completo, qual é a fmp condicional 
do número em uso na ilha de auto- serviço? 

19. A fdp conjunta de pressões dos pneus dianteiros é dada 

no Exercício 9. 

a. Determine a fdp condicional de K, dado que X = jc, 
e a fdp condicional de X, dado que Y = v. 

b. Se a pressão no pneu direito for 22 psi, qual é a 
probabilidade de o pneu esquerdo ter uma pressão de 
no mínimo 25 psi? Compare com P(Y > 25). 

c. Se a pressão no pneu direito for 22 psi, qual é a 
pressão esperada no pneu esquerdo e qual é o desvio 
padrão da pressão desse pneu? 

20. Sejam X,, X 2 , e X 3 as vidas úteis dos componentes 1, 2 

e 3 em um sistema de três componentes. 

a. Como você definiria a fdp condicional de X 3 , dado 
que X, = jc, e X 2 = jc 2 ? 

b. Como você definiria a fdp condicional conjunta de 
X 2 e X 3 dado que X, = jc,? 

21. Que condição de f Y \ x (y I Jc) equivale à independência de 
Xe r? 


5.2 I Valores Esperados, 

Covariância e Correlação 

Vimos anteriormente que qualquer função h(X ) de uma única va X é por si mesma uma variável aleatória. En- 
tretanto. para calcular E[/t(X)], não foi necessário obter a distribuição de probabilidades de h(X)\ ao contrário, 
£[MX)) foi calculado como uma média ponderada dos valores de h(x), em que a função do peso foi a fmp p(x) 
ou a fdp/(x) de X. Um resultado semelhante é obtido para a função h(X, K) de duas variáveis aleatórias de dis- 
tribuição conjunta. 


PROPOSIÇÃO 


Sejam X e Y as vas de distribuição conjunta com fmp p(x, y) ou fdp f(x, y ), conforme as 
variáveis sejam discretas ou contínuas. Então, o valor esperado de uma função h(X, E), 

representada por E[h(X, K)] ou /x w *. n , é dado por 



X X h ^ x ' y) ' p( x ' y) 

se X e Y forem discretos 

E[h(X, Y) = , 

x y 

r°° ro» 

- 


J J h(x, y) • f(x, y) dx dy 

se X e Y forem contínuos 
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Exemplo 5.13 

Cinco amigos compraram ingressos para um determinado show. Se os ingressos forem dos lugares de 1-5 em 
certa fileira e os ingressos forem distribuídos aleatoriamente entre os cinco, qual é o número esperado de as- 
sentos que separam quaisquer dois dos cinco? Sejam Xe Y os números dos lugares da primeira e da segunda 
pessoas, respectivamente. Possíveis pares de (X, Y) são {(1. 2), (1, 3),..., (5, 4)}, e a fmp conjunta de (X, >0 e 


0 caso contrário 

O número de lugares que separam as duas pessoas é h(X, Y) = |x — Y \ - 1. A tabela a seguir fornece 
h(x, y) para cada par (x, y) possível. 


x 


h(x, y ) 

1 

2 

3 

4 

5 


i 



0 

1 

2 

3 


2 

0 

— 

0 

1 

2 

y 

3 

1 

0 

— 

0 

1 


4 

2 

1 

0 

— 

0 


5 

3 

2 

1 

0 

— 


Dessa forma, 

E[h(X, P)] = ZZ h(x, y) • p(x, y) = X £(l*-yl “ = 1 

(JC..V) JT=I.V=1 

x * y 

Exemplo 5.14 

No Exemplo 5.5, a fdp conjunta da quantidade X de amêndoas e da quantidade Y de castanhas de caju em uma 
lata de castanhas de 1 libra foi 

_ Í24xy 0<x< l,0<y< l,x + y^l 
J\x, y) j q caso contrário 

Se 1 libra de amêndoas custar à empresa US$ 1,00, 1 libra de castanhas de caju custar US$ 1,50 e 1 libra 
de amendoins custar US$ 0,50, então o custo total do conteúdo de uma lata é 

/i(x, y> = (i)x + (i,5)y + (0,5)(i - x - y> = o,5 + o,5x + y 

(uma vez que 1 - X - Y do peso consiste em amendoins). O custo total esperado é 

£[/i(X, y)] = í í h(x, y) •/(*, >') dx dy 

J— oo*'— ac 

= í‘ f (0,5 + 0,5* + y) • 24.ry dy dx = US$ 1,10 ■ 

'0 ' 0 

O método para calcular o valor esperado de uma função h(X u ..., X„) de n variáveis aleatórias é semelhante 
ao método usado para duas variáveis aleatórias. Se os X,s forem discretos, E[h(X lt ..., X„)] é uma sotnlj 
n-dimensional; se os X,s forem contínuos, é uma integral n-dimensional. 

Covariância 

Quando duas variáveis aleatórias X e Y não são independentes, geralmente é de interesse avaliar quão fortemen 
estão relacionadas uma com a outra. 
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•5 em 
as- 
tunda 


DEFINIÇÃO 


A covariância entre duas vas Xe fé 

Cov(X, Y) = 

E[(X - fx x )(Y - aí,)] 

J 

[X x (X - /X x )(y - fXy)p(x, y) X, Y discretas 

I X V 

" 

(x — fJ. x )(y — fi y )f(x, y) dx dy X, Y contínuas 

I 

-JcJ—OG 


foi 


irnece 



O fundamento lógico da definição é o seguinte. Suponha que X e Y tenham uma relação positiva forte en- 
tre si, pela qual queremos dizer que valores grandes de X tendem a ocorrer com valores grandes de Y , e valores 
pequenos de X, com valores pequenos de Y. Então, a maior parte da massa ou densidade de probabilidade estará 
associada a (x - /x v ) e (y - /z K ), ambos positivos (Xef acima de suas respectivas médias) ou ambos negativos, 
de modo que o produto (. x — /JL x )(y — M>) tende a ser positivo. Dessa forma, para uma relação positiva forte, 
Cov(X, Y) deve ser positiva. Para uma relação negativa forte, os sinais de (x — /jl x ) e (y — /jl y ) tenderão a ser 
opostos, levando a um produto negativo. Assim, para uma relação negativa forte, Cov(X, Y) deve ser negativa. 
Se X e Y não estão fortemente relacionadas, os produtos positivo e negativo tenderão a cancelar um ao outro, 
produzindo uma covariância próxima de 0. A Figura 5.4 ilustra as diferentes possibilidades. A covariância de- 
pende tanto do conjunto de pares possíveis como das probabilidades. Na Figura 5.4, as probabilidades poderiam 
ser trocadas sem alterar o conjunto de pares possíveis, o que pode mudar drasticamente o valor da Cov(X, Y). 





Mx 

(a) 


Mx Mx 

(b) (c) 


Figura 5.4 p(x, y) = 1/10 para cada um dos 10. pares correspondentes aos pontos 
indicados, (a) covariância positiva; (b) covariância negativa; (c) covariância próxima de zero 


Exemplo 5.15 

As fmps marginal e conjunta de X = quantidade dedutível das apólices de seguro de automóvel e Y = quanti- 
dade dedutível das apólices de seguro residencial no Exemplo 5.1 eram 


y 


P(x,y) 

0 

100 

200 

X 

100 

250 

y 

0 

100 

200 

100 

y 

0,20 

0,10 

0,20 

PÁX) 

0,5 

0,5 

Pr(y) 

0,25 

0,25 

0,5 

250 

0,05 

0,15 

0,30 









onde fi x = XxpxOt) = 175 e /l t> = 125. Portanto, 

Cov(X, Y) = 21 (*" 175)(y - 125)p(;t, y) 

(*, y) 

= (100 - 175)(0 - 125)(0,20) + • • • 
+ (250 - 175X200 - 125)(0,30) 


= 1875 
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A fórmula simplificada a seguir para Cov(X, Y) facilita os cálculos. 


PROPOSIÇÃO 


Cov(X, Y) = E(XY) - fi x • fi r 


De acordo com essa fórmula, não é necessária nenhuma subtração intermediária; somente no final dr cál- 
culo fi x • fiy é subtraído de E(XY). A demonstração envolve expandir (X — p, x ){ Y — fi Y ) e depois calcular o valor 
esperado de cada termo separadamente. Observe que Cov(X, X) = E(X 2 ) — p,| = V(X). 

Exemplo 5.16 (continuação do Exemplo 5.5) 

As fdps marginal e conjunta de X = quantidade de amêndoas e de Y = quantidade de castanhas de caju eram 


y) _ Í24*y 0<.r< l,0<y< l,x + y< l 
J ’ ' 1 0 caso contrário 


= Í12x(l -X? 1 

J \ 0 caso contrário 


fr(y) é obtido, substituindo x por y em/ Y (.r). É fácil demonstrar que (x x = /x y = | , e 


E(XY) = í í xy f(x, y) dx dy = í í xy • 24jcv dy dx 

J-ooJ-^c Jq Jq 


= 8 f ’ 1 -xYdx = 


2 _ 

15 


Assim, Cov(X, Y) = ^ — (})(|) = js ~ ^ = ~~h- A covariância negativa, neste caso, é razoável, porque 
uma quantidade maior de amêndoas na lata implica uma quantidade menor de castanhas de caju. 


Pode parecer que a relação no exemplo do seguro seja bastante forte, uma vez que Cov(X, Y) = 1875, 
enquanto Cov(X, K) = -jj, no exemplo das castanhas, parece uma relação fraca. Infelizmente, a covariân" 
possui uma deficiência grave que impossibilita a interpretação de um valor calculado. No exemplo do seguro, 
suponha que tivéssemos expressado a quantia dedutível em centavos e não em dólares. Então, 100X subs 
tuiria X, lOOf substituiria Y, e a covariância resultante seria Cov(100X, 100JO = (100) (lOO)Cov(X, K) = 
18.750.000. Se, por outro lado, a quantia dedutível tivesse sido expressa em centenas de dólares, a covari; 
cia calculada teria sido (0,0 1 )(0,0 1 )( 1875) = 0,1875. A deficiência da covariância é que seu valor calcul 
depende diretamente das unidades de medida. Teoricamente, a escolha das unidades não deve afetar a medida 
da intensidade da relação. O que é obtido definindo-se a escala da covariância. 

Correlação 


DEFINIÇÃO 


O coeficiente de correlação de X e Y. representado por Corr(X, f), p xy , ou simplesmente 
p, é definido por 


Px.y = 


Cov(X, Y) 
(T x • o> 
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Exemplo 5.17 

É fácil verificar que no problema do seguro, do Exemplo 5.15, E^X 2 ) = 36.250, = 36.250 - (175) 2 = 5625, 

<r x = 75, E(Y 2 ) = 22.500, a 2 y = 6875, e <r» = 82,92. O que dá 


P = 


1875 

(75)(82,92) 


= 0,301 


A proposição a seguir mostra que p corrige a deficiência da Cov(X, K), além de sugerir como reconhecer a 
existência de uma relação (linear) forte. 


PROPOSIÇÃO 


1. Se a e c são ambos positivos ou negativos, 

Corr(aX + b, cY + d) = Corr(X, Y) 

2. Para quaisquer duas vas X e Y, — 1 £ CorríX, K) £ 1 . 


A proposição 1 diz precisamente que o coeficiente de correlação não é afetado por mudança linear das 
unidades de medida (se, por exemplo, X = temperatura em °C, então, 9X15 + 32 = temperatura em °F). De 
acordo com a proposição 2, a relação positiva mais forte possível é evidenciada por p = + 1 , enquanto a relação 
negativa mais forte possível corresponde a p = -1. A demonstração da primeira proposição está esquematizada 
no Exercício 35, e a da segunda aparece no Exercício Suplementar 87, no final do capítulo. Para fins descritivos, 
a relação será descrita como forte se I p I S: 0,8, moderada se 0,5 < |p| < 0,8, e fraca se | p| £0,5. 

Se pensarmos que p(.v, y) ou/(.v, y) determinam um modelo matemático para a forma como as duas variáveis 
numéricas X e Y são distribuídas em determinada população (altura e peso, pontuação SAT verbal e pontuação 
SAT quantitativa etc.), então, p é uma característica ou parâmetro da população que mede o quão fortemente X 
e Y estão relacionados na população. No Capítulo 12, consideraremos uma amostra de pares (jc,, y, ),..., (.t,„ y„) 
da população. O coeficiente de correlação da amostra r será, então, definido e usado para fazer inferências 
sobre p. 

0 coeficiente de correlação p não é, na verdade, uma medida geral da força de uma relação. 


PROPOSIÇÃO 


1. Se X e Y são independentes, então p = 0, porém p = 0 não implica independência. 

2. p = 1 ou -1 se e somente se Y = aX + b para quaisquer números aeb com a =# 0. 


Essa proposição diz que p é uma medida do grau da relação linear entre Kef.e somente quando as duas 
variáveis estiverem perfeitamente relacionadas de forma linear é que p assumirá os valores extremos positivo ou 
negativo. Um p menor que 1 em valor absoluto indica somente que a relação não é completamente linear, mas 
que ainda pode haver uma relação não-linear bastante forte. Além disso, p = 0 não implica que X e Y sejam in- 
dependentes, mas apenas que há ausência completa de relação linear. Quando p = 0, X e Y são ditos não-cor- 
relacionados. Duas variáveis podem ser não-correlacionadas, porém altamente dependentes, pois pode 
existir uma relação não-linear forte; assim, cuidado para não tirar muitas conclusões a partir de p = 0. 


Exemplo 5.18 

Sejam X e Y vas discretas com fmp conjunta 


p(x, y) = 


4 

0 


u, y) = (-4, 1), (4, -1), (2, 2), (-2, -2) 
caso contrário 
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Os pontos que recebem massa de probabilidade positiva estão identificados no sistema de coordenadas (jc, 
v) na Figura 5.5. É evidente, pela figura, que o valor de X é determinado completamente pelo valor de Y e vice- 
versa, de modo que as duas variáveis são totalmente dependentes. Entretanto, pela simetria /i x = = 0 e 

E(XY) = (-4)j 4- (-4)j 4- (4)j + (4)^ = 0, assim, Cov(X, Y) = E(XY ) — /x x • = 0 e dessa forma p XY = 0. 

Embora haja perfeita dependência, também há ausência completa de qualquer relação linear! 

2 t • 

• i — 

I 1 1 1 1 1 1 1 

-4 -3 -2 -l 12 3 4 

-1 -- -• 

• -2 -- 

Figura 5.5 A população de pares do Exemplo 5.18 ■ 

Um valor de p próximo de 1 não implica necessariamente que aumentar o valor de X cause um aumento em 
Y. Implica somente que valores grandes de X estão associados a valores grandes de Y. Por exemplo: na popu- 
lação de crianças, o tamanho do vocabulário e o número de cáries são correlacionados de forma bastante posi- 
tiva, mas certamente não é verdade que as cáries façam o vocabulário aumentar. Ao contrário, os valores de am- 
bas as variáveis tendem a aumentar com a idade das crianças, uma terceira variável. Para as crianças de certa 
idade, provavelmente haja correlação muito baixa entre o número de cáries e o tamanho do vocabulário. Resu- 
mindo, associação (uma alta correlação) não é a mesma coisa que causa. 


Exercícios | Seção 5.2 (22-36) 

22. Um instrutor fez perguntas curtas que consistem de 
duas partes. Para um estudante selecionado aleatoria- 
mente, seja X = o número de pontos ganhos na primeira 
parte e Y = o número de pontos ganhos na segunda. 
Suponha que a fmp conjunta de X e Y seja dada na 
tabela a seguir. 


y 


(x,y) 

0 

5 

10 

15 


0 

0,02 

0,06 

0,02 

0,10 

JC 

5 

0.04 

0,15 

0,20 

0,10 


10 

0,01 

0,15 

0,14 

0,01 


a. Se a pontuação constante do boletim for o número 
total de pontos ganhos nas duas partes, qual é a pon- 
tuação registrada esperada E(X 4- Y)1 

b. Se o máximo das duas pontuações for registrado, 
qual é a pontuação registrada esperada? 

23. A diferença entre o número de clientes na fila da caixa 
expressa e o número de clientes na caixa superexpressa 
no Exercício 3 é X, - X 2 . Calcule a diferença esperada. 

24. Seis indivíduos, incluindo A e B. sentam-se ao redor de 
uma mesa redonda de forma total mente aleatória. Su- 
ponha que os lugares sejam numerados de 1 , . . . , 6. Seja 
X - o número do assento de A e Y = o número do as- 
sento de B. Se A mandar um bilhete, ao redor da mesa. 


para B, na direção em que estão mais próximos, quan- 
tos indivíduos (incluindo A e B) você espera que pe- 
guem o bilhete? 

25. Um agrimensor deseja traçar uma região quadrada cu- 
jos lados têm comprimento L. Entretanto, devido a erro 
de medição, ele esboça um retângulo, em que os lados 
norte e sul têm comprimento X . e os lados leste e oeste, 
comprimento Y. Suponha que X e Y sejam indepen- 
dentes e que cada um seja distribuído uniformemente 
no intervalo [L - A, L 4- A] (onde 0 < A < L). Qual é 
a área esperada do retângulo resultante? 

26. Considere uma pequena balsa que possa acomodar car- 
ros e ônibus. O pedágio para carros são US$ 3, e para 
ônibus, US$ 10. Sejam X e Y o número de carros e 
ônibus, respectivamente, levado em uma única viagem. 
Suponha que a distribuição conjunta de X e Y seja 
aquela dada na tabela do Exercício 7. Calcule a receita 
esperada de uma única viagem. 

27. Annie e Alvie combinaram encontrar-se para almoçar 
juntos entre meio-dia e 13h. Represente por X a hora de 
chegada de Annie, por Y a de Alvie, e suponha que Xe 
Y sejam independentes com fdps 

3JC 2 0 < jc < 1 
0 caso contrário 


1 
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My) = {o 


0 <y < 1 
caso contrário 


Qual é o tempo esperado que a pessoa que chega 
primeiro deve aguardar pela outra? [Sugestão: /?(X, Y) = 

\x-Y\.) 

28. Mostre que. se X e Y são vas independentes, então 
E(XY) = E(X) • E(Y). Aplique essa expressão no Exer- 
cício 25. [Sugestão: considere o caso contínuo com 
f(x,y)=fÁx)-fr(y).] 

29. Calcule o coeficiente de correlação p de X e Y do 
Exemplo 5.16 (a covariância já foi calculada). 

30. a. Calcule a covariância de X e Y no Exercício 22. 
b. Calcule p de X e Y no mesmo exercício. 

31. a. Calcule a covariância entre X e Y no Exercício 9. 
b. Calcule o coeficiente de correlação p para X e Y. 

32. Reconsidere as vidas úteis X e Y do componente do mini- 
computador, como descrito no Exercício 12. Determine 
E(XY). O que se pode dizer sobre Cov(X, Y) e p? 


33. Use o resultado do Exercício 28 para mostrar que, 
quando X e Y são independentes, Cov(X, Y) = Corr(X, 
Y) = 0. 

34. a. Lembrando-se da definição de cr 2 para uma única va 

X, escreva uma fórmula apropriada para calcular a 
variância da função /?(X, Y) de duas variáveis 
aleatórias. [Sugestão: lembre-se de que a variância é 
apenas um valor esperado especial.] 
b. Use essa fórmula para calcular a variância da pon- 
tuação registrada /t(X, Y) [= max(X, Y)] na parte (b) 
do Exercício 22. 

35. a. Use as regras de valor esperado para demonstrar que 

Cov(aX + />, cY + d) = ac Cov(X, Y). 

b. Use a parte (a) junto com as regras de variância e 
desvio padrão para demonstrar que Corr(aX + b , 
cY + d) = Corr(X, Y) quando a e c têm o mes- 
mo sinal. 

c. O que acontece s tate tiverem sinais contrários? 

36. Mostre que, se Y = aX + b (a # 0), então Corr(X, Y) = 
+ 1 ou -1 . Sob quais condições p = + 1 ? 


5.3 I Estatísticas e Suas Distribuições 

As observações de uma única amostra foram denotadas no Capítulo 1 por x,, x 2 ,..., x„. Considere a seleção de 
duas amostras diferentes de tamanho n oriundas da mesma distribuição da população. Os x,s da segunda amostra 
serão sempre virtualmente diferentes, pelo menos um pouco, dos XjS da primeira amostra. Por exemplo: uma 
primeira amostra de n = 3 carros de um tipo específico pode resultar em consumos de combustível x, = 30,7, 
x 2 = 29,4, x, = 31,1, enquanto uma segunda amostra pode fornecer x, = 28,8, x 2 = 30,0 e x, = 31,1. Antes de 
obtermos os dados, há incerteza acerca do valor de cada x*. Devido a essa incerteza, antes de os dados estarem 
disponíveis, consideramos cada observação como uma variável aleatória e denotamos a amostra por X„ X 2 , ... , 
X, (letras maiusculas para variáveis aleatórias). 

Essa variação nos valores observados implica, por sua vez, que o valor de qualquer função das observações 
da amostra - como a sua média, o seu desvio padrão ou a sua quarta dispersão - também varia de amostra para 
amostra. Isto é, antes de obter x,,.„, x„, há incerteza quanto ao valor de x, o valor de s, e assim por 

diante. 

Exemplo 5.19 

Suponha que a resistência do material de um tipo específico de espécime selecionado aleatoriamente possui uma 
distribuição de Weibull com valores de parâmetro a = 2 (formato) e /3 = 5 (escala). A curva de densidade cor- 
respondente é exibida na Figura 5.6. As fórmulas da Seção 4.5 fornecem 

fi = E(X) = 4,431 1 ) ü = 4,1628 a 2 = V(X) = 5,365 a = 2,316 


A média excede a mediana devido à inclinação positiva da distribuição. 
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Figura 5.6 A curva de densidade de Weibull do Exemplo 5.19 


Usamos MINITAB para gerar seis amostras diferentes, cada uma com n = 10 a partir dessa distribuição 
(resistências do material para seis grupos diferentes de 10 espécimes cada). Os resultados são exibidos na Tabela 
5.1, seguidos pelos valores da média, mediana e desvio padrão de cada uma das amostras. Repare primeiro que 
as 10 observações em qualquer amostra específica são diferentes das observações em qualquer outra amostra. 
Em segundo lugar, os seis valores da média amostrai são diferentes uns dos outros, como os seis valores da me- 
diana e do desvio padrão da amostra. O mesmo acontece com as médias trincadas de 10% da amostra, com suas 
quartas dispersões da amostra e assim por diante. 


Tabela 5.1 Amostras da distribuição de Weibull do Exemplo 5.19 


Amostra 

1 

2 

3 

4 

5 

6 

1 

6,1 171 

5,07611 

3,46710 

1,55601 

3,12372 

8,93795 

2 

4,1600 

6,79279 

2,71938 

4,56941 

6,09685 

3,92487 

3 

3,1950 

4,43259 

5,88129 

4,79870 

3,41181 

8,76202 

4 

0,6694 

8,55752 

5,14915 

2,49759 

1,65409 

7,05569 

5 

1,8552 

6,82487 

4,99635 

2,33267 

2,29512 

2,30932 

6 

5,2316 

7,39958 

5,86887 

4,01295 

2,12583 

5,94195 

7 

2,7609 

2,14755 

6,05918 

9,08845 

3,20938 

6,74166 

8 

10,2185 

8,50628 

1,80119 

3,25728 

3,23209 

1,75468 

9 

5,2438 

5,49510 

4,21994 

3,70132 

6,84426 

4,91827 

10 

4,5590 

4,04525 

2,12934 

5,50134 

4,20694 

7,26081 

X 

4,401 

5,928 

4,229 

4,132 

3,620 

5,761 

X 

4,360 

6,144 

4.608 

3,857 

3,221 

6,342 

s 

2,642 

2,062 

1,611 

2,124 

1,678 

2.496 
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DEFINIÇÃO 


Estatística é qualquer quantidade cujo valor possa ser calculado com base nos dados da 
amostra. Antes de obter os dados, existe a incerteza quanto ao valor que resultará de qual- 
quer estatística específica. Portanto, estatística é uma variável aleatória e será representada 
por uma letra maiuscula; uma letra minúscula será usada para representar o valor calcu- 
lado ou observado da estatística. 


Assim, a média amostrai, considerada como estatística (antes de a amostra ser selecionada ou de o experi- 
mento ter sido feito), é representada por X; o valor calculado dessa estatística é x. De forma semelhante, S re- 
presenta o desvio padrão da amostra visto como estatística e seu valor calculado é s. Se amostras de dois tipos 

diferentes de tijolos forem selecionadas e as resistências à compressão individuais forem denotadas por X 

X„. e Y Y,„ respectivamente, então a estatística X — Y, diferença entre as duas resistências à compressão mé- 

dia amostrai, geralmente é de grande interesse. 

Qualquer estatística, sendo uma variável aleatória, possui uma distribuição de probabilidades. Em particu- 
lar. a média amostrai X possui uma distribuição de probabilidades. Suponha, por exemplo, que n = 2 compo- 
nentes são selecionados aleatoriamente, e o número de quebras^durante o período de garantia é determinado para 
cada um. Valores possíveis para o número médio de quebras X da amostra são 0 (se X, X, = 0), 0,5 (se X, — 
0 e X : = 1 ou X, = 1 e X 2 = 0), 1, 1,5, ...). A distribuição de probabilidade de X especifica P(X = 0), 
P(X = 0,5), e assim por diante, a partir das quais outras probabilidades, como P(1 ^ X < 3) e P(X s 2,5) po- 
dem ser calculadas. De forma semelhante, se, para uma amostra de tamanho n = 2, os únicos valores possíveis 
da variância da amostra forem 0, 1 2,5 e 50 (que será o caso se X, e X : puderem adotar somente os valores 40, 
45 e 50), então a distribuição de probabilidades de S 2 fornece P(S 2 — 0), P(S 2 = 12,5) e P(S 2 = 50). A dis- 
tribuição de probabilidade de uma estatística às vezes é denominada distribuição de amostragem para enfati- 
zar que ela descreve como a estatística varia de valor em todas as amostras que possam ser selecionadas. 

Amostras Aleatórias 

A distribuição de probabilidade de qualquer estatística específica depende não somente da distribuição da po- 
pulação (normal, uniforme etc.) e do tamanho da amostra n, como também do método de amostragem. Considere 
a seleção de uma amostra de tamanho n = 2 de uma população, formada apenas dos três valores 1, 5 e 10, e 
suponha que a estatística de interesse seja a variância da amostra. Se a amostragem é feita “com reposição”, en- 
tão. = 0 será o resultado se X, = X : . Entretanto, S 2 não pode ser igual a 0 se a amostragem for “sem reposição”. 
Assim, P{S : = 0) = 0 para um método de amostragem, e essa probabilidade é positiva para o outro método. 
Nossa próxima definição descreve um método de amostragem geralmente encontrado (pelo menos aproximada- 
mente) na prática. 


DEFINIÇÃO 


Diz-se que as vas X,, X 2 , ... , X„ formam uma amostra aleatória (simples) de tamanho n se 

1. Os X,s são vas independentes. 

2. Todo X, possui a mesma distribuição de probabilidades. 


As Condições 1 e 2 podem ser parafraseadas, dizendo-se que os X,s são independente e identicamente dis- 
tribuídos (iid). Se a amostragem for com reposição ou de uma população (hipotética) infinita, as Condições 1 e 
2 são satisfeitas exatamente. Tais condições serão satisfeitas aproximadamente se a amostragem for sem 
reposição, ainda que o tamanho da amostra n seja muito menor que o tamanho da população N. Na prática, se 
nIN < 0,05 (no máximo 5% da população é coletada), podemos prosseguir como se os X,s formassem uma 
amostra aleatória. A virtude desse método de amostragem é que a distribuição de probabilidade de qualquer es- 
tatística pode ser obtida com mais facilidade do que qualquer outro método de amostragem. 
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Existem dois métodos gerais para se obter informações sobre a distribuição da amostragem da estatística. 
Um método envolve cálculos com base nas regras de probabilidade; o outro envolve a realização de um experi- 
mento de simulação. 


Dedução da Distribuição da Amostragem de uma Estatística 

As regras de probabilidade são usadas para obter a distribuição de uma estatística, contanto que seja uma 
função “bem simples” dos X,s e que haja relativamente poucos valores de X diferentes na população; ou então, 
que a distribuição da população possua uma forma “apropriada”. Nossos dois próximos exemplos ilustram 
tais situações. 


Exemplo 5.20 

Um grande centro de manutenção de automóveis cobra US$ 40, US$ 45 e US$ 50 para regulagem de carros de 
quatro, seis e oito cilindros, respectivamente. Se 20% das regulagens são feitas nos carros de quatro cilindros, 
30% nos carros de seis cilindros e 50% nos carros de oito cilindros, então a distribuição de probabilidade da re- 
ceita de uma única regulagem selecionada aleatoriamente é dada por 


X 

40 

45 

50 


p(x) 

0.2 

0,3 

0,5 

com p. — 46,5, cr 2 = 15,25 


(5.2) 


Suponha que, em certo dia, somente dois trabalhos de manutenção envolvam regulagem. Seja X, = receita 
da primeira regulagem e X 2 = a receita da segunda. Suponha que X , e X 2 sejam independentes, cada uma com a 
distribuição de probabilidades mostrada em (5.2) [de modo que X, e X 2 constituam uma amostra aleatória da dis- 
tribuição (5.2)]. A Tabela 5.2 lista os pares possíveis (x„ x 2 ), a probabilidade de cada um [calculada 
usando-se (5.2) e _a hipótese de independência], e os valores resultantes de 3c e s 2 . Para obter a distribuição de 
probabilidade de X, a receita média amostrai por regulagem, devemos considerar cada valor possível de x e cal- 
cular sua probabilidade. Por exemplo: x = 45 ocorre três vezes na tabela com probabilidades 0,10, 0,09 e 0,10, 
assim 


pA 45) = P(X = 45) = 0,10 + 0,09 + 0,10 = 0,29 


Tabela 5.2 Resultados, probabilidades e valores de x e s~ do Exemplo 5.20 


*1 

*2 

P(x „ * 2 ) 

X 

s 2 

40 

40 

0,04 

40 

0 

40 

45 

0,06 

42,5 

12,5 

40 

50 

0,10 

45 

50 

45 

40 

0,06 

42,5 

12,5 

45 

45 

0,09 

45 

0 

45 

50 

0,15 

47,5 

12,5 

50 

40 

0,10 

45 

50 

50 

45 

0,15 

47,5 

12,5 

50 

50 

0,25 

50 

0 


Ps=(50) = P(S 2 = 50) = />(X, = 40, X 2 = 50 ou X, = 50, X 2 = 40) 

= 0,10 -h 0,10 = 0,20 


De forma similar. 
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As distribuições de amostragem completas de Xe S 2 são exibidas em (5.3) e (5.4). 


X 

40 

42.5 

45 

47,5 

50 

Piifx) 

0.04 

0,12 

0,29 

0,30 

0,25 


s 2 

0 

12,5 

50 

Ps*(s 2 ) 

0.38 

0,42 

0,20 


(5.3) 


(5.4) 


A Figura 5.7 ilustra o histograma probabilístico da distribuição original (5.2) e da distribuição X (5.3). A 
figura sugere, primeiro, que a média (valor esperado) da distribuição X seja igual à média 46,5 da distribuição 
original, uma vez que ambos os histogramas parecem estar centralizados no mesmo lugar. 


0.5 



0,3 




0.29 

0,30 

0,25 







0.2 




0,12 




i 

1 

i 

0,04 

r-t— 

I 

1 

I 

1 

40 

45 

50 

40 

42.5 

45 

47,5 

50 


Figura 5.7 Histogramas probabilísticos da distribuição subjacente e da distribuição X do Exemplo 5.20 

Pela (5.3), 

IL-x = E(X) = 2xpx(x) = (40)(0,04) + • • • + (50)(0,25) = 46,5 = j u. 

Em segundo lugar, parece que a distribuição X possui dispersão (variabilidade) menor do que a distribuição 
original, uma vez que a massa de probabilidade moveu-se em direção à média. Novamente pela (5.3), 

<n = v(x) = Xx 2 -px(x)- ú 

= (40) : (0,04) + • • • + (50) 2 (0,25) - (46,5) 2 

= 7,625 = = — 

2 2 

A variância de X é precisamente metade da variância original (pois, n = 2). O valor médio de S 2 é 

= E(5r) = ls 2 • psis 2 ) 

= (0)(0,38) + (12,5)(0,42) + (50)(0,20) = 15,25 = cr 2 

Isto é, a distribuição da amostragem X está centrada na média da população ji e a distribuição da 
amostragem S 2 , está centrada na variância da população cr 2 . 

Se quatro regulagens foram feitas no dia de interesse, a receita média amostrai X seria baseada em uma 
amostra aleatória de quatro X-s, cada um com distribuição (5.2). Eventualmente, mais cálculos produzem a fmp 
de X para n = 4 como 


X 

40 

41,25 

42,5 

43,75 

45 

46,25 

47,5 

48,75 

50 

Pxix) 

0,0016 

0.0096 

0,0376 

0,0936 

0,1761 

0,2340 

0,2350 

0,1500 

0,0625 


Pelos dados anteriores, para n = 4, jn* = 46,50 =fi e ot = 3,8125 = cr 2 /4. A Figura 5.8 é um histograma 
de probabilidade dessa fmp. 
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40 42.5 45 47,5 50 

Figura 5.8 Histograma probabilístico para X com base em n = 4 do Exemplo 5 20 


O Exemplo 5.20 sugere, antes de qualquer coisa, que o cálculo de p^x) e p s Ks 2 ) é cansativo. Se a dis- 
tribuição original (5.2) permitisse mais de três valores possíveis 40, 45 e 50, então, mesmo para n = 2. os cál- 
culos teriam sido mais complexos. O exemplo sugere também, no entanto, que existem algumas relações gerais 
entre E(X), V(X), E(S 2 ), e a média p. e a variância a 2 da distribuição original, as quais são confirmadas na pró- 
xima seção. Agora, considere um exemplo em que a amostra aleatória é tirada de uma distribuição contínua. 


O tempo gasto para atender a um cliente na caixa de um minimercado é uma variável aleatória que tem dis- 
tribuição exponencial com parâmetro A. Suponha que X, e X. sejam os tempos de atendimento para dois clientes 
diferentes, assumidos como independentes. Considere o tempo total de atendimento T„ = X, + X : dos dois 
clientes também uma estatística. A fdc de T„ é para r > 0, . 


Essa é uma fdp gama {a — 2 e (3 = 1/À). A fdp de X = TJ2 é obtida da relação [X £ x) se e somente se 
{ < 2r ) conforme 


Exemplo 5.21 




= 1 - e"* - A te~» 


A região de integração está ilustrada na Figura 5.9. 



Figura 5.9 Região de integração para obter a fdc de T„ do Exemplo 5 21 


A fdp de T„ é obtida diferenciando F r (t): 



(5.5)1 



(5.61 
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A média e a variância da distribuição exponencial subjacente são /a = 1/A e a 2 = 1/A 2 . Pelas Expressões 
(5.5) e (5.6), pode-se demonstrar que E(X) = 1/A, V(X) = 1/(2A 2 ), E(T„) = 2/A e V(T„) = 2/A 2 . Tais resultados 
novamente sugerem algumas relações gerais entre médias e variâncias de X, T„ e a distribuição subjacente. ■ 

Experimentos de Simulação 

0 segundo método para se obter informações sobre a distribuição de amostragem de uma estatística é fazer um 
experimento de simulação. Esse método geralmente é usado quando é muito difícil ou complicado calcular a de- 
rivada por meio das regras de probabilidade. Tal experimento sempre é feito virtualmente, com o auxílio de um 
computador. As seguintes características do experimento devem ser especificadas: 

1. A estatística de interesse (X, 5, uma média aparada específica etc.) 

2. A distribuição da população (normal com p = 1 00 e a = 15, uniforme com limite inferior A = 5 e limi- 
te superior B = 10 etc.) 

3. O tamanho da amostra n (por exemplo, n = 1 0 ou n = 50) 

4. O número de repetições k (por exemplo, k = 500) 

Então, use um computador para obter k amostras aleatórias diferentes, cada uma de tamanho n, da dis- 
tribuição da população designada. Para cada amostra, calcule o valor da estatística e construa um histograma dos 
k valores calculados. O histograma fornece a distribuição de amostragem aproximada da estatística. Quanto maior 
o valor de k, melhor é a tendência da aproximação (a distribuição de amostragem real surge quando k — > *). Na 
prática, k = 500 ou 1000 geralmente é suficiente, se a estatística for “bem simples”. 

Exemplo 5.22 

A distribuição da população para nosso primeiro estudo de simulação é normal com p = 8,25 e <x = 0,75, con- 
forme ilustrado na Figura 5.10. (O artigo “Platelet Size in Myocardial Infarction” [Tamanho da Plaqueta no ln- 
farto do Miocárdio] (Brítish Med. 1983, p. 449-451) sugere essa distribuição para o volume de plaquetas nos 
indivíduos sem histórico de problemas cardíacos graves.] 



Figura 5.10 Distribuição normal, com = 8,25 e «r = 0,75 

Realmente fizemos quatro experimentos diferentes, com 500 repetições para cada um. No primeiro experi- 
mento, as 500 amostras de n = 5 observações cada foram geradas usando-se o MINITAB, e os tamanhos da 
amostra para os outros três foram n = 10, n = 20 e n = 30, respectivamente. A média amostrai foi calculada 
para cada amostra e os histogramas resultantes dos valores de x são exibidos na Figura 5.1 1. 

A primeira coisa a se observar sobre os histogramas é seu formato. Para uma aproximação razoável, cada qua- 
tro aproximações parecem com uma curva normal. A semelhança seria ainda mais impressionante se todo 
histograma fosse feito com base em mais de 500 valores de jf. Em segundo lugar, cada histograma está centrado 
aproximadamente em 8,25, a média da população que está servindo como amostra. Se os histogramas se baseassem 
era uma sequência sem fim de valores de x, seus centros seriam exatamente a média da população, 8,25. 

0 aspecto final a ser observado nos histogramas é sua dispersão relativa entre eles. Quanto menor o valor 
de n, maior a extensão com que a distribuição da amostragem se dispersa em relação ao valor médio. E por esse 
motivo que os histogramas de n = 20 e n = 30 baseiam-se em intervalos de classe menores que os dos dois 
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tamanhos menores da amostra. Para os tamanhos de amostra maiores, a maior parte dos valores de x está bem 
próxima de 8,25. Esse é o efeito do cálculo da média. Quando n é pequeno, um único valor de x incomum pode 
resultar em um valor de x longe do centro. Com um tamanho amostrai maior, quaisquer valores de x incomuns 
quando incluídos no cálculo da média com os demais valores da amostra, ainda tendem a produzir um valor de 
3c próximo a fi. Combinar essas percepções produz um resultado que desperta sua intuição: X determinado com 
base em n grande tende a estar mais próximo de /li do que se fosse determinado com base em 
n pequeno. 


Frequência 

relativa 




7.35 7,65 7,95 8,25 8,55 8,85 9,15 7,50 7,80 8,10 8,40 8,70 

7.50 7,80 8,10 8,40 8,70 9,00 9,30 7,65 7,95 8,25 8,55 8.85 

(a) (b) 


Freqüência 

relativa 



7,80 8,10 8,40 8,70 
7,95 8,25 8,55 

(c) 



7,80 8,10 8,40 8,70 
7,95 8,25 8,55 
(d) 


Figura 5.11 Histogramas da amostra de x com base em 500 amostras, cada uma consistindo de n observações: 

(a) n = 5; (b) n = 10; (c) n = 20; (d) n = 30 I 


Exemplo 5.23 

Considere um experimento de simulação em que a distribuição da população seja bastante inclinada. A Figura 
5.12 mais adiante mostra a curva de densidade da vida útil de determinado tipo de controle eletrônico [esta curva 
é realmente uma distribuição lognormal com £(ln(X)) = 3 e V(ln(X)) = 0,4], Novamente, a estatística de inte- 
resse é a média amostrai X. O experimento utilizou 500 repetições e considerou os mesmos quatro tamanhos da 
amostra, como no Exemplo 5.22. Os histogramas resultantes, e um gráfico de probabilidade normal pelo 
MIN1TAB para os 500 valores de x com base em n = 30, são exibidos na Figura 5.13. 
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Figura 5.12 Curva de densidade para o experimento de simulação do Exemplo 5.23 
[EÍX) = fi = 21 , 7584 , V{X) = a : = 82 , 1449 ] 

Ao contrário do caso normal, esses histogramas diferem no formato. Em particular, ficam progressivamente 
menos inclinados à medida que o tamanho da amostra n aumenta. A média dos 500 valores de x para os quatro 
tamanhos diferentes da amostra está bem próxima do valor médio da distribuição da população. Se cada his- 
tograma fosse baseado em uma seqüência sem fim de valores de 3c, não apenas 500, os quatro seriam centrados 
exatamente em 21,7584. Dessa forma, valores diferentes de n alteram o formato, mas não o centro da distri- 
buição de X. A comparação dos quatro histogramas na Figura 5.13 também mostra que, à medida que n aumenta, 
a dispersão dos histogramas diminui. Aumentar n resulta em um grau maior de concentração, em tomo do valor 
médio da população, e faz o histograma se parecer mais com uma curva normal. O histograma da Figura 5.13(d) 
e o gráfico de probabilidade normal na Figura 5. 13(e) fornecem evidência convincente de que o tamanho de uma 
amostra de n = 30 é suficiente para superar a inclinação da distribuição da população e dar uma distribuição de 
amostragem de X aproximadamente normal. ■ 


Exercícios I Seção 5.3 (37-45) 


37. Uma determinada marca de sabão para máquina de 
lavar louça é vendida em três tamanhos: 25 oz, 40 oz e 
65 oz. Vinte por cento de todos os compradores esco- 
lhem a caixa de 25 oz. 50% escolhem a caixa de 40 oz 
e os 30% restantes escolhem a caixa de 65 oz. Sejam X, 
eX 2 os tamanhos dos pacotes escolhidos por dois com- 
pradores selecionados independentemente. 

a. Determine a distribuição de X, calcule E(X) e com- 
pare a p. 

b. Determine a distribuição da amostragem da variân- 
cia da amostra S 2 , calcule E(S 2 ) e compare com a 2 . 

38. Existem dois semáforos a caminho do meu trabalho. 
SejaX, o número de sinais de trânsito em que eu tenho 
de parar, e suponha que a distribuição de X, seja 

a seguinte: 


X 

0 1 

2 

Pix i) 

0,2 0,5 

0,3 


Seja X 2 o número de faróis de trânsito em que eu tenho de 
parar a caminho de casa; X 2 é independente de X, . Assuma 
que X 2 possui a mesma distribuição que X,, de modo que 
X,, X 2 é uma amostra aleatória n = 2. 

a. Seja T a = X, + X 2 e determine a distribuição de 
probabilidades de T 0 . 

b. Calcule /z r . Como ele está relacionado a /x, a média 
da população? 

c. Calcule cr}. Como ele está relacionado a o* 2 , va- 
riância da população? 

39. Sabe-se que 80% de todos os zip drives de marca A fun- 
cionam de forma satisfatória durante o período de ga- 
rantia (são “sucessos”). Suponha que n = 10 drives 
sejam selecionados aleatoriamente. Seja X = número 
de sucessos na amostra. A estatística X/n é a proporção 
da amostra (fração) de sucessos. Obtenha a distribuição 
de amostragem dessa estatística. [ Sugestão : um valor 
possível de X/n é 0,3, correspondente a X = 3. Qual é a 
probabilidade desse valor (que tipo de variável aleató- 
ria é X)?] 
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Densidade 


Densidade 





(a) 



Densidade 


Densidade 




(c) 


(d) 



Avcragt: 21.7891 
StOev 1 57396 
N 500 


W-tesí for NormaMy 
R 09975 

P-Value (approx) >0.1000 


(C) 


Figura 5.13 Resultados do experimento de simulação do Exemplo 5.23: (a) histograma de x para n = 5; 
(b) histograma de x para n = 10; (c) histograma de x para n = 20; (d) histograma de x para n = 30; (e) grá- 
fico de probabilidade normal para n - 30 (do MINITAB) 


40. Uma caixa contém 10 envelopes fechados numerados 

de 1 10. Os cinco primeiros não têm dinheiro, os três 

seguintes têm US$ 5 cada e, em cada um dos dois últi- 
mos, há uma nota de US$ 10. Uma amostra de tamanho 
3 é selecionada com reposição para obtermos uma 
amostra aleatória, e você ganha a quantia maior em 
qualquer um dos envelopes escolhidos. Se X„ X 2 e X, 
representam as quantias nos envelopes selecionados, a 
estatística de interesse é M = o máximo de X,, X 2 e X 3 . 
a. Obtenha a distribuição de probabilidades dessa 
estatística. 


b. Descreva como você conduziria um experimento de 
simulação para comparar as distribuições de M dos 
diversos tamanhos da amostra. Como você faria para 
adivinhar a mudança da distribuição à medida que 
n aumenta? 

41. Seja X o número de pacotes que estão sendo enviados 
por um cliente selecionado aleatoriamente em uma de- 
terminada empresa de remessas. Suponha que a dis- 
tribuição de X seja como segue: 
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X 

12 3 4 

p(x) 

0.4 0,3 0,2 0,1 


a. Considere uma amostra aleatória de tamanho n = 2 
(dois clientes) e seja X o número médio da amostra 
de pacotes enviados. Obtenha a distribuição de pro- 
babilidades de X. 

b. Refira-se à parte (a) e calcule P(X < 2,5). 

c. Considere novamente uma amostra aleatória de 
tamanho n = 2, mas agora enfoque a estatística R = 
o intervalo da amostra (diferença entre os valores 
maior e menor na amostra). Obtenha a distribuição 
de R. [Sugestão: calcule o valor de R para cada re- 
sultado e use as probabilidades da parte (a).] 

d. Se uma amostra aleatória de tamanho n = 4 for se- 
lecionada, qual é P(X < 1,5)? ( Sugestão : você não 
deve listar todos os resultados possíveis, somente 
aqueles para os quais x < 1,5.) 

42. Uma empresa mantém três escritórios em certa região, 
cada um com dois funcionários. As informações sobre 
os salários anuais (milhares de dólares) seguem abaixo: 

Escritório 1 1 2 2 3 3 

n* de funcionários 1 2 3 4 5 6 

salário 29,7 33,6 30,2 33,6 25,8 29,7 

a. Suponha que dois desses funcionários sejam sele- 
cionados aleatoriamente, dentre os seis (sem repo- 
sição). Determine a distribuição da amostragem X do 
salário médio da amostra. 


b. Suponha que um dos três escritórios seja sele- 
cionado aleatoriamente. Sejam X, e X 2 os salá- 
riosdos dois funcionários. Determine a distribuição 
deX. 

c. Como E{X) das partes (a) e (b) é comparado ao salá- 
rio médio da população fil 

43 . Suponha que a quantidade de líquido despejada por 
certo equipamento seja uniformemente distribuída com 
limite inferior A = 8 oz e limite superior B = 10 oz. 
Descreva como você conduziria experimentos de simu- 
lação para comparar a distribuição de amostragem da 
quarta dispersão (da amostra) para tamanhos amostrais 
n = 5, 10, 20 e 30. 

44 . Faça um experimento de simulação usando um pacote 
estatístico ou outro software para estudar a distribui- 
ção de X quando a distribuição da população é Weibull 
com a = 2 e (3 = 5, como no Exemplo 5.19. Considere 
os quatro tamanhos da amostra n = 5, 10, 20 e 30 e, em 
cada caso, utilize 500 repetições. Para qual desses 
tamanhos de amostra a distribuição de X parece ser 
aproximadamente normal? 

45 . Faça um experimento de simulação usando um pacote 
estatístico ou outro software para estudar a distribuição 
de X quando a distribuição da população é lognormal 
com £(ln(X)) = 3 e V(ln(X)) = 1. Considere os quatro 
tamanhos de amostra n = 10, 20, 30 e 50 e, em cada 
caso, utilize 500 repetições. Para qual desses tamanhos 
de amostra a distribuição de X parece ser aproximada- 
mente normal? 


5.4 


A Distribuição da Média Amostrai 


A importância da média amostrai X surge de seu uso para tirar conclusões sobre a média da população fx. Al- 
guns dos procedimentos de inferência, usados com mais freqiiência. baseiam-se nas propriedades da 
distribuição de X. A apresentação inicial dessas propriedades foi feita nos cálculos e experimentos de simulação 
da seção anterior, onde salientamos as relações entre E(X) e /lí e também entre V(X). cr 2 e n. 


PROPOSIÇÃO 


Sejam X „ X 2 , ... , X„ elementos da amostra aleatória de uma distribuição com valor médio 
ix e desvio padrão cr. Então, 

1. E(X) = /U.J = ix 

2. V(Aj = cr* = cr/n e cr* = cr/Vn 

Além disso, com T„ = X, + • • • + X n (o total da amostra), E(T 0 ) = n/x, 

V(T a ) = na 2 e er r> = Vncr. 
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As demonstrações desses resultados foram transferidas para a próxima seção. De acordo com o Resultado 
1, a distribuição (isto é, probabilidade) da amostragem de X é centrada precisamente na média da população da 
qual a amostra foi selecionada. O Resultado 2 mostra que a distribuição de X se toma mais concentrada em tomo 
de /x à medida que o tamanho da amostra n aumenta. Com diferença marcante, a distribuição de T„ se dispersa 
mais à medida que n aumenta. A média desloca a probabilidade para o meio, enquanto o total dispersa a proba- 
bilidade em um intervalo de valores mais amplo. 

Exemplo 5.24 

Em um teste de fadiga à tração de um espécime de titânio, o número esperado de ciclos para a primeira emissão 
acústica (usada para indicar o início da trinca) é /x = 28.000, e o desvio padrão do número de ciclos é cr = 5000. 
Sejam X„ X 2 , ... , X 2f os elementos de uma amostra aleatória de tamanho 25, em que cada X, é o número de ci- 
clos em um espécime diferente, selecionado aleatoriamente. Então, o valor esperado do número de ciclos médio 
da amostra até a primeira emissão é E(X) = /x = 28.000, e o número jotal esperado de ciclos para os 25 es- 
pécimes é E(T„) = n/x = 25(28.000) = 700.000. Os desvios padrão de X e T„ são 

(Ta = a/Vn = ^22 = 1000 
oy = Vna = V25(5000) = 25.000 

Se o tamanho da amostra aumenta para n = 100, E(X) fica inalterado, mas cr y = 500, metadede seu valor 
anterior (o tamanho da amostra deve ser quadruplicado para reduzir à metade o desvio padrão de X). ■. 

Caso de Distribuição da População Normal 

Ao reexaminar o experimento de simulação do Exemplo 5.22, observamos que quando a distribuição da popu- 
lação é normal, cada histograma de valores de x é bem aproximado pela curva normal. Segue o resultado exato. 


PROPOSIÇÃO 


Sejam X„ X 2 ,..., X„ os elementos da amostra aleatória de uma distribuição normal com mé- 
dia /x e desvio padrão cr. Então, para qualquer n, X é normalmente distribuído (com 
média /x e desvio padrão o/Vn), como é T„ (com média n/x e desvio padrão Vmr). 1 


Sabemos tudo sobre as distribuições de X e T„ quando a distribuição da população é normal. Em particular, 
as probabilidades, como P(a < X ^ b) e P(c < T„ < d), podem ser obtidas simplesmente pela padronização. A 
Figura 5.14 ilustra a proposição. 



Figura 5.14 Distribuição da população normal e distribuições de amostragem de X 


' É possível demonsirar o resultado de T„ quando n = 2, usando o método no Exemplo 5.21, mas os detalhes são confusos. A fórmula geral normalmente 
é demonstrada usando-se uma ferramenta teórica denominada função de geração de momento. Uma das referências do capítulo pode ser consultada para 

obter-se mais informações. 
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Exemplo 5.25 

0 tempo que um rato de determinada subespécie, selecionado aleatoriamente leva para encontrar o caminho em 
um labirinto é uma va distribuída normalmente com /i = 1 ,5 min e cr = 0,35 min. Suponha que cinco ratos se- 
jam selecionados. Sejam X,,..., X 5 seu tempo no labirinto. Assumindo que X, é uma amostra aleatória dessa dis- 
tribuição normal, qual é a probabilidade de o tempo total T a = X, 4- • • • + X 5 dos cinco estar entre 6 e 8 min? 
Pela proposição, T u possui distribuição normal com /i, = n/i = 5(1,5) = 7,5 e variância 

(Tf = na - = 5(0,1225) = 0,6125, assim, cr T „ = 0,783. Para padronizar T„, subtraia /t r e divida por oy : 


P(6 < T„ < 8) = P( - — — < Z < 
V 0,783 


8 ~ 7,5 \ 
0,783 ) 


= P(- 1,92 < Z< 0,64) = $(0,64) - $(-1,92) = 0,7115 


A determinação da probabilidade de o tempo médio da amostra X (uma variável distribuída normalmente) 
ser no máximo 2,0 min requer fix = (i = 1,5 e cr* = cr/Vn = 0,35/V5 = 0,1565. Então, 


P(X < 2,0) = />Z< 


2,0 - 1,5 \ _ 


0,1565 


= P(Z < 3,19) = $(3,19) = 0,9993 


Teorema do Limite Central 

Quando os X,s são distribuídos normalmente, X também é para cada tamanho de amostra n. O experimento de 
simulação do Exemplo 5.23 sugere que, mesmo quando a distribuição da população é altamente não-normal, o 
cálculo da média produz uma distribuição em forma de sino mais acentuada do que a que está servindo como 
amostra^ Uma hipótese razoável é que, se n for grande, uma curva normal adequada aproximará a distribuição 
real de X. O enunciado formal de tal resultado é o teorema mais importante da probabilidade. 


TEOREMA 


Teorema do Limite Central (TLC) 

X,, X>, . . . , X„ formam a amostra aleatória de uma distribuição com média /x e variância 
cr. Então, se n é suficientemente grande, X tem aproximadamente uma distribuição normal 
com fix =ii e crf = cr 2 /n, e T„ também tem aproximadamente uma distribuição nor- 
mal com /i T = n/i, a] = na 2 . Quanto maior o valor de n, melhor a aproximação. 


A Figura 5.15 ilustra o Teorema do Limite Central. De acordo com o TLC, quando n é grande e queremos 
calcular a probabilidade, tal como P(a < X < b), precisamos somente “fingir” que X é normal, padronizá-lo e 
usar a tabela normal. A resposta resultante será jproximadamente correta. A resposta exata pode ser obtida so- 
mente encontrando, primeiro, a distribuição de X, assim, o TLC fornece um atalho de fato impressivo. A prova 
do teorema envolve matemática muito avançada. 


Distribuição de X para 
n grande (aproximadamente normal) 



Figura 5.15 0 Teorema do Limite Central ilustrado 
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Exemplo 5.26 

Quando um lote de certo produto químico é preparado, a quantidade de uma impureza específica no lote é uma 
variável aleatória com valor médio de 4,0 g e desvio padrão de 1,5 g. Se 50 lotes forem preparados indepen- 
dentemente. qual é a probabilidade (aproximada) de a quantidade média de impureza X da amostra estar entre 
3,5 e 3,8 g? De abordo com a regra prática dita em poucas palavras, n = 50 é grande o suficiente para que o TLC 
seja aplicável. X então possui aproximadamente uma distribuição normal com valor médio fu-x = 4,0 e 
(Tf = 1 ,5/V50 = 0,2121, assim. 


P( 3,5 < x < 3,8) *» - z - 


3,8 - 4,0 \ 

0,2121 j 


= $(-0.94) - 


$(-2,36) = 0,1645 


Exemplo 5.27 

Uma determinada organização de consumidores normalmente reporta o número de defeitos graves de cada carro | 
novo examinado. Suponha que o número de tais defeitos de certo modelo seja uma variável aleatória com valor 
médio 3,2 e desvio padrão 2,4. Dentre 100 carros selecionados aleatoriamente desse modelo, qual é a pro- 
babilidade de o número médio da amostra de defeitos graves exceder 4? Seja X, o número de defeitos graves do 
/-ésimo carro na amostra aleatória. Observe que X, é uma va discreta, mas que o TLC é aplicável, se a variável 
de interesse for discreta ou contínua. Além disso, apesar de o desvio padrão dessa variável não-negativa ser 
grande em relação ao_valor médio sugerir que sua distribuição é positivamente inclinada, o tamanho grande de 
amostra implica que X tem a distribuição aproximadamente normal. Usando fiy = 3,2 e o* = 0,24, 

P(X > 4) « p[z > J = l - $(3,33) = 0,0004 ■ 

O TLC fornece compreensão clara do motivo pelo qual muitas variáveis aleatórias têm distribuições de 
probabilidade aproximadamente normais. Por exemplo: o erro de medição em um experimento científico pode 
ser visto como a soma de um número de irregularidades e erros subjacentes de pouca importância. 

Embora a utilidade do TLC para inferência seja, em breve, aparente, o teor intuitivo do resultado faz muitos 
estudantes iniciantes sentirem dificuldade. Voltando à Figura 5.7, o histograma probabilístico à esquerda c um 
retrato da distribuição que está servindo como amostra. É discreta e bem inclinada, de modo que não parece ser j 
uma distribuição normal. A distribuição de X para n = 2 começa a exibir certa simetria, e is^o é até mais pro- 
nunciado para n = 4 na Figura 5.8. A Figura 5.16 contém a distribuição de probabilidades de Xpara n = 8, bem 
como um histograma probabilístico para essa distribuição. Com Hx = = 46,5 e o* = o/Vn = _3,905/\ 8 = 

1,38, se ajustarmos uma curva normal com tal média e desvio padrão por meio do histograma de X, as áreas de 
retângulos do histograma probabilístico estarão razoavelmente bem aproximadas pelas áreas da curva normal, 
pelo menos na parte central da distribuição. O desenho de T„ é semelhante, exceto pelo fato de a escala hori- 
zontal ser muito mais dispersa, com T„ variando de 320 (.r = 40) a 400 (x = 50). 

Uma dificuldade prática na aplicação do TLC é saber quando n é suficientemente grande. O problema é que 
a precisão da aproximação de um n específico depende do formato da distribuição subjacente original que está 
servindo como amostra. Se a distribuição subjacente está próxima do formato de sino, então a aproximação será 
boa, mesmo para um n pequeno, ao passo que. se estiver longe desse formato, será necessário um n grande, 
Usaremos a regra prática a seguir, que geralmente é um pouco conservadora. 


Regra prática 

Se ;i > 30, o Teorema do Limite Central pode ser utilizado. 
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Existem distribuições de população para as quais mesmo com n 40 ou 50 não é suficiente, mas tais dis- 
tribuições raramente são encontradas na prática. 


X 

40 

40,625 

41,25 

41,875 

42,5 

43,125 

p(x) 

0,0000 

0,0000 

0,0003 

0,0012 

0,0038 

0,0112 

X 

43,75 

44,375 

45 

45,625 

46,25 

46,875 

P(X) 

0,0274 

0,0556 

0,0954 

0,1378 

0,1704 

0,1746 

X 

47,5 

48,125 

48,75 

49,375 

50 


p(x) 

0,1474 

0,0998 

0,0519 

0,0188 

0,0039 



(a) 



(b) 

Figura 5.16 (a) Distribuição de probabilidades de X para n = 8; (b) Histograma probabilístico e aproximação 
normal à distribuição de X quando a distribuição original é como no Exemplo 5.20 

Outras Aplicações do Teorema do Limite Central 

0 TLC pode ser usado para justificar a aproximação normal da distribuição binomial discutida no Capítulo 4. 
Lembre-se de que uma variável binomial X é o número de sucessos em um experimento binomial que consiste 
de n tentativas independentes de sucesso/falha com p = P(S) para qualquer tentativa específica. Defina novas vas 
Xi, T 2 , ... , X„ por 


í 1 se a í-ésima tentativa for um sucesso ,. 

X, — \ (i = 1, . . . , n) 

10 se a í-ésima tentativa for um fracasso 

Em virtude de as tentativas serem independentes e P(S) ser constante de tentativa para tentativa, os X,s são iid 
(uma amostra aleatória de uma distribuição de Bemoulli). O TLC, então, implica que, se n for suficientemente 
grande, tanto a soma como a média dos X,s têm aproximadamente distribuições normais. Quando os X,s são soma- 
dos. adiciona-se 1 a cada S que ocorre e 0 a cada F, assim, X, + • • • + X n = X. A média amostrai dos X,s é X/n, a 
proporção da amostra de sucessos. Isso é, X e X/n são aproximadamente normais quando n é grande. O tamanho 
necessário da amostra para essa aproximação depende do valor de p: quando p está próximo de 0,5, a distribuição 
de cada X, é razoavelmente simétrica (veja a Figura 5. 1 7 na próxima página), ao passo que a distribuição é relati- 
vamente inclinada quando p está próximo de 0 ou 1. Usar a aproximação somente se np > 10 e n(l — p) 2: 10 
garante que n é grande o suficiente para superar qualquer inclinação na distribuição de Bemoulli subjacente. 


oi oi 

(a) (b) 

Figura 5.17 Duas distribuições de Bemoulli: (a) p = 0,4 (razoavelmente simétrica); (b) p = 0,1 (muito inclinada) 
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Lembre-se da Seção 4.5, em que X possui uma distribuição lognormal se \n(X) tiver distribuição normal. 


PROPOSIÇÃO 


Seja X,, X 2 , ... , X n uma amostra aleatória de uma distribuição para a qual somente valores 
positivos são possíveis [P{X t > 0) = 1]. Então, se n for suficientemente grande, o produto 
Y = X,X 2 X n terá aproximadamente uma distribuição lognormal. 


Para demonstrar a proposição, observe que 

ln (Y) = ln(X,) + ln(AT 2 ) + • • • + ln(X n ) 

Uma vez que ln(10 é a soma de vas [as ln(X,)s] independentes e identicamente distribuídas, é apro- 
ximadamente normal quando n é grande, pois, o próprio Y tem aproximadamente uma distribuição lognormal. 
Como exemplo da aplicabilidade desse resultado, Bury (Statistical Models in Applied Science , Wiley, p. 590) 
discute que o processo de danos no fluxo do plástico e propagação de trincas é multiplicativo, de modo que 
as variáveis, como porcentagem de alongamento e resistência à ruptura, têm aproximadamente distribuições 
lognormais. 


Exercícios Seção 5.4 (46-57) 

46. O diâmetro interno de um anel de pistão selecionado 
casualmente é uma variável aleatória com valor médio 
de 12 cm e desvio padrão de 0,04 cm. 

a. Se X é o diâmetro médio para uma amostra aleatória 
de n_= 16 anéis, onde a distribuição de amostragem 
de X está centrada, qual é o desvio padrão da dis- 
tribuição de XI 

b. Responda as questões propostas na parte (a) para um 
tamanho de amostra de n = 64 anéis. 

c. Para qual das duas amostras aleatórias, a da parte 
(a) ou a da parte (b), X é mais provável de estar 
dentro de 0,01 cm de 12 cm? Explique seu racio- 
cínio. 

47. Consulte o Exercício 46. Suponha que a distribuição do 
diâmetro seja normal. _ 

a. Calcule P(1 1,99 < X < 12,01 ) quando n = 16. 

b. Qual é a probabilidade de o diâmetro médio da 
amostra exceder 12,01 quando n = 25? 

48. Sejam X,, X 2 , ... , X 100 os pesos líquidos reais de 100 
sacos de fertilizantes de 50 lb selecionados aleato- 
riamente. 

a. Se o peso esperado de cada saco for 50 e a variân- 
cia 1, calcule P( 49,75 ^ X ^ 50,25) (aproximada- 
mente), usando o TLC. 

b. Se o peso esperado for 49,8 lb, e não 50 lb, de modo 
que na média os sacos não estejam muito cheios, cal- 
cule P(49,75 < X < 50,25). 

49. Há 40 alunos em uma classe de estatística básica. Com 
base nos anos de experiência, o instrutor sabe que o 
tempo necessário para corrigir o primeiro questionário. 


escolhido aleatoriamente, é uma variável aleatória cora 1 
valor esperado de 6 min e desvio padrão de 6 min. 

a. Se os tempos de correção forem independentes e o I 
instrutor começar a corrigir às 1 8h50 sem parar, qual I 
é a probabilidade (aproximada) de terminar as cor- 1 
reções antes de o noticiário das 23h, na televi-1 
são, começar? 

b. Se as notícias de esportes começam às 23hl0. qualé 
a probabilidade de ele perder parte das notícias, se 
esperar até que a correção seja concluída antes de I 
ligar a televisão? 

50. A resistência à ruptura de um rebite possui valor médio II 
de 10.000 psi e desvio padrão de 500 psi. 

a. Qual é a probabilidade de a resistência à ruptura mé- I 
dia de uma amostra aleatória de 40 rebites estar en- II 
tre 9.900 e 10.200? 

b. Se o tamanho da amostra fosse 1 5, e não 40, a proba- 11 
bilidade pedida na parte (a) poderia ser calculada II 
com as informações dadas? 

51. O tempo que um candidato a uma hipoteca, sele- II 
cionado aleatoriamente, gasta para preencher um I 
formulário tem distribuição normal com valor médio I 
de 10 min e desvio padrão de 2 min. Se cinco indi-jl 
víduos preenchem um formulário em um dia, e seis, 1 1 
em outro, qual é a probabilidade de a quantidade* 
média de tempo da amostra em cada dia ser de no II 
máximo 1 1 min? 

52. A vida útil de certo tipo de bateria é distribuída nor-fl 
malmente com valor médio de 10 horas e desvio padrão* 
de 1 hora. Há quatro baterias em um pacote. Que valor* 
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de vida útil faz com que a vida total de todas as baterias 
em um pacote exceda tal valor em apenas 5% de todos 
os pacotes? 

53. É sabido que a dureza de Rockwell de certo tipo de 
pinos tem valor médio de 50 e desvio padrão de 1 ,2. 

a. Se a distribuição for normal, qual é a probabilidade 
de a dureza média de uma amostra aleatória de 9 
(nove) pinos ser no mínimo 51? 

b. Qual é a probabilidade (aproximada) de a dureza 
média de uma amostra aleatória de 40 pinos ser de 
no mínimo 5 1 ? 

54. Suponha que a densidade sedimentar (g/cm) de um es- 
pécime selecionado aleatoriamente de uma determi- 
nada região tenha distribuição normal com média de 
2,65 e desvio padrão de 0,85 (sugerido em “Modeling 
Sediment and Water Column Interactions for Hy- 
drophobic Pollutants” (Modelo de Sedimentos e Intera- 
ções da Coluna de Água para Poluentes Hidrofóbicos) 
Water Research, 1984, p. 1169-1174). 

a. Se uma amostra aleatória de 25 espécimes é sele- 
cionada, qual é a probabilidade de a densidade sedi- 
mentar média amostrai ser de no máximo 3,00? En- 
tre 2,65 e 3,00? 

b. Qual deve ser o tamanho de uma amostra para garan- 
tir que a primeira probabilidade da parte (a) seja no 
mínimo 0,99? 


55. O primeiro trabalho de uma classe de cálculo estatístico 
envolve a execução de um programa curto. Se a expe- 
riência anterior indica que 40% de todos os alunos não 
cometerão erros de programação, calcule a probabilidade 
(aproximada) de que em uma classe de 50 alunos: 

a. pelo menos 25 não cometerão erros. ( Sugestão : 
aproximação da normal para a binomial.) 

b. entre 15 e 25 (inclusive) não cometerão erros. 

56. O número de multas por estacionamento irregular 
emitidas em uma determinada cidade em um dia de se- 
mana qualquer possui distribuição de Poisson com pa- 
râmetro À = 50. Qual é a probabilidade aproximada de 

a. entre 35 e 70 multas serem dadas em um dia 
específico? ( Sugestão : quando À é grande, uma va 
de Poisson possui aproximadamente distribuição 
normal.) 

b. o número total de multas dadas durante os cinco dias 
da semana estar entre 225 e 275? 

57. Suponha que a distribuição do tempo X (em horas) 
gasto pelos alunos de certa universidade em um projeto 
específico seja gama com parâmetros a = 50 e /3 = 2. 
Em virtude de cx ser grande, pode-se demonstrar que X 
possui distribuição aproximadamente normal. Use esse 
fato para calcular a probabilidade de um aluno sele- 
cionado aleatoriamente gastar no máximo 125 horas 
no projeto. 


5.5 


Distribuição de uma Combinação Linear 


A X média amostrai e o T„ total da amostra são casos especiais de um tipo de variável aleatória que surge com 
bastante freqüência em aplicações estatísticas. 


DEFINIÇÃO 


Dado um conjunto de n variáveis aleatórias Àj,..., X„ e n constantes numéricas a u ..., a„, 
a va 

Y=a l X l + --- + a„X n = ±a i X i (5.7) 

(=i 

é denominada combinação linear dos X,’s. 

L 


Assumindo o, = a 2 = • • • = a n = 1 fornece Y= X t + • ■ • + X n = T a , e a, = a 2 = • • • = a„ = { produz 

y - , X, + h 'X r = ^(X ; + • • • + X n ) = X -T n = X. Observe que não é requerido que os X,s sejam independentes 

ou identicamente distribuídos. Todos os X,s podem ter distribuições diferentes e, dessa forma, valores médios e 
variâncias distintas. Consideramos primeiro o valor esperado e a variância de uma combinação linear. 
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PROPOSIÇÃO 


Suponha que X,, X 2 . . . X„ tenham valores médios /t„ . . . , /u.„, respectivamente, e variân- 
cias a 2 , . . . , cr;, respectivamente. 

1. Se os X,s são ou não independentes, 

E{a x X x + a 2 X 2 + ■■■ + a n X n ) = a x E(X x ) + a 2 E(X 2 ) + • • • + a n E(X„) 

= a,/t, + • • • + a n /i n (5.8) 

2. Se X„..., X„ são independentes. 


V(a x X x + a 2 X 2 + --- + a„X n ) = a]V(X x ) + a\V(X 2 ) + • • • + a;V(X n ) 


= a 2 x <r 2 x + • • • + a 2 n ai 

(5.9) 

e 


(Ta,x l +-+ajc. = Vafai + • • • + alai 

(5.10) 

3. Para qualquer X„ . . . , X„, 


V^.X, + • • • + a„X„) = ± ov(X„ X,) 

<= 1 1 

(5.11) 


As demonstrações estão esquematicamente no final da seção. Uma paráfrase de (5.8) é que o valor dese- 
jado de uma combinação linear é a mesma combinação linear dos valores esperados - por exemplo: E( 2X, + 
5X 2 ) = 2/x, + 5/tj. O resultado (5.9) da Proposição 2 é um caso especial de (5.1 1) da Proposição 3; quando os 
X,s são independentes, Cov(X„ X,) = 0 para i =# j e = V(X,) para í = j (essa simplificação realmente ocorre 
quando os X,s são não-correlacionados, uma condição mais fraca que a independência). Generalizando para o 
caso de uma amostra aleatória (X,s iid) com a, = l/n para cada i fornece E(x) =/xe V(x) = a 2 /n, conforme dis- 
cutido na Seção 5.4. Aplica-se um comentário semelhante às regras de T a . 


Exemplo 5.28 

Um posto de gasolina vende três tipos do produto: gasolina comum, gasolina aditivada e gasolina super. Elas 
custam US$ 1,20, US$ 1,35 e US$ 1,50 por galão, respectivamente. Sejam X„ X 2 , e X, os valores desses gal' 
comprados em um dia específico. Suponha que os X,s sejam independentes com /t, = 1000, /u = 500, /t, = 300, 
cr, = 100, a 2 = 80, e<r, = 50. A receita das vendas é Y = l,2Xj + 1,35X 2 + 1,5X,, e 

E(Y) = 1,2/t, + 1,35/t, + 1,5/tj = $ 2325 
V(K) = (1,2 )V? + (1,35)V 2 + ( 1 ,5) 2 cr| = 31.689 
<t y = V3 1.689 = $178,01 

Diferença Entre Duas Variáveis Aleatórias 

Um caso especial importante de combinação linear resulta de n = 2, a x = 1, e a 2 = — 1: 

Y = a x X x + a 2 X 2 = X x - X 2 
Temos, então, a seguinte conclusão da proposição. 


COROLÁRIO 


E(X x - X 2 ) = E(X x ) - E(X 2 ) e, se X x e X 2 são independentes, V(X x - X 2 ) = V(X.) + 
V(X 2 ). 


O valor esperado de uma diferença é a diferença entre os dois valores esperados, mas a variância da ' 
rença entre duas variáveis independentes é a soma , não a diferença, das duas variâncias. Há tanta variabili 
em X x - X 2 como em X, + X 2 [escrever X, — X 2 = X, + (— 1)X 2 , ( — 1 )X 2 varia tanto quanto o próprio X 2 ]. 
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Exemplo 5.29 

Um fabricante de automóveis equipa um determinado modelo com um motor de seis cilindros ou de quatro cilin- 
dros. Sejam por X, e X 2 o consumo de combustível de carros com seis e quatro cilindros selecionados de modo 
independente e aleatório, respectivamente. Com /x, = 22, n* = 26, o-, = 1,2, e tr 2 = 1,5, 

E(X, - X 2 ) = /ti, - ^ = 22 - 26 = -4 
V(X, - X 2 ) = a 2 , + <t\ = (1,2) 2 + (1,5) 2 = 3,69 
<r x ,_ x , = V^69 = 1,92 

Se fizermos nova indicação de que X, se refere ao carro de quatro cilindros, então E(X, - X 2 ) = 4, mas a 
variância da diferença ainda será 3,69. ■ 

Caso de Variáveis Aleatórias Normais 

Quando os X,s formam uma amostra aleatória de uma distribuição normal, X e T„ são ambos distribuídos nor- 
malmente. Eis um resultado mais geral sobre combinações lineares. 


PROPOSIÇÃO 


Se A',, X 2 ,..., X„ são vas independentes, distribuídas normalmente (com médias e/ou va- 
riâncias possivelmente diferentes), então qualquer combinação linear dos X,s também tem 
distribuição normal. Em particular, a própria diferença X, - X, entre duas variáveis inde- 
pendentes e normalmente distribuídas é normalmente distribuída. 


Exemplo 5.30 (Continuação do Exemplo 5.28) 

A receita total da venda dos três tipos de gasolina em um dia específico foi Y = 1 ,2X, + 1 ,35X 2 + 1 ,5X,, e cal- 
culamos [ly = 2325 e (assumindo a independência) o> = 178,01. Se os X,s são distribuídos normalmente, a 
probabilidade de a receita exceder 2500 é 

I P(Y > 2500) = p(z > 2500 ~ 2325 \ 

\ 178,01 / 

= P(Z > 0,98) = 1 - <6(0,98) = 0,1635 ■ 

0TLC também pode ser generalizado de modo que se aplique a certas combinações lineares. Grosso modo, 
se n for grande e nenhum termo individual igualmente provável de contribuir muito para o valor total, então Y 
possui aproximadamente uma distribuição normal. 

Provas para o caso de n = 2 

Para o resultado dos valores esperados, suponha que X, e X 2 sejam contínuas com fdp conjunta /(x,, jc 2 ). Então 

E(a,X, + a 2 X 2 ) = £JH(a,x, + a^fix „ * 2 ) dx t dx 2 
= <2i jTjNri /(*„ * 2 ) dx 2 dx, 

+ a 2 j I x 2 f(x„ x 2 ) dx, dx 2 
= a 1 \_X\fxfa 1 ) dx, + a 2 \jcj x ix 2 ) dx 2 


= a,E(X,) + a 2 E(X 2 ) 
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A soma substitui a integração no caso discreto. O argumento para o resultado da variância não requer que 
seja especificado se a variável é discreta ou contínua. Lembrando que V(L) = E[(Y — /z,) 2 ], 

V(a,X | + a 2 X 2 ) = E{[a { X\ + a 2 X 2 — (Oj/x, + a 2 fi 2 )] 2 } 

= E{a](X i - /X ,) 2 + al(X 2 - + la x a 2 (X x ~ - ^)) 

A expressão dentro das chaves é uma combinação linear das variáveis F, = ( X ] — At,) 2 , Y 2 = (X 2 — /jl 2 ) 2 , e 
Y 3 = (X, — /jl 1 )(X 2 — A^>), assim, fazer a operação de E para os três termos resulta em ajViX^ 4* a 2 V(X 2 ) 4- la x a 2 
Cov(X,, X 2 ), como requerido. ■ 


Exercícios I Seção 5.5 (58-74) 

58. Uma empresa de remessa trabalha com contêineres de 
três tamanhos diferentes: (1) 27 pé 3 (3 X 3 X 3), (2) 
125 pé 3 e (3) 512 pé 3 . Seja X, (í = 1, 2, 3) o número de 
contêineres de tipo i enviados durante uma determinada 
semana. Com ^ = £(X,) e crj= V(X ( ), suponha que os 
valores médios e os desvios padrão sejam como segue: 

At, = 200 fjb 2 = 250 /x 3 = 100 

cr, = 10 a 2 = 12 cr 3 = 8 

a. Assumindo que X,, X 2 , X 3 sejam independentes, cal- 
cule o valor esperado e a variância do volume total en- 
viado. [ Sugestão : volume = 27X, 4 125X 2 4 512X 3 .] 

b. Seus cálculos estariam necessariamente corretos se 
os X,s não fossem independentes? Explique. 

59. Sejam X,, X 2 , e X 3 os tempos necessários para realizar 
três reparos sucessivos em determinada oficina. 
Suponha que sejam vas normais independentes com 
valores esperados At,, /in, e A^ e variâncias cr 2 , cr;, e cr 2 , 
respectivamente. 

a. Se At = A L 2 — = 60 e cr] = cr\ = cr] = 15, cal- 

cule />(X, 4 X 2 4 X 3 < 200). Qual é />(150 < 
X, 4 X 2 4 X 3 < 200)? 

b. Usando os /a,s e cr,s^ dados na parte (a), calcule 
P(55 < X) e P ( 58 < X < 62). 

c. Usando os fx,s e cr,s dados na parte (a), calcule 
P {- 10 < X, - 0,5X 2 - 0,5X 3 < 5). 

d. Se At, = 40, Ak> = 50, /I 3 = 60, a] = 10, cr; = 12 e 
al = 14, calcule P(X, 4 X 2 4 X 3 < 160) e P(X, 4 
X 2 > 2 X 3 ). 

60. Cinco automóveis do mesmo tipo farão uma viagem de 
300 milhas. Os dois primeiros usarão uma marca de 
gasolina econômica, e os outros três, uma marca reno- 
mada. Sejam X,, X 2 , X 3 , X 4 , e X 5 os consumos de com- 
bustível observados (milhas/galão) dos cinco carros. 
Suponha que essas variáveis sejam independentes e nor- 
malmente distribuídas com At, = /Jh = 20, /x . 3 = A^ = 
Ats = 21 e cr 2 = 4 para a marca econômica e 3,5 para a 
marca renomada. Defina a va Y como 

X, 4X 2 X 3 4 X 4 4 X 5 
2 3 

de modo que Y seja a medida da diferença do consumo 
entre a gasolina econômica e a renomada. Calcule 


P ( 0 < Y) e P(-l < Y < 1). [ Sugestão : Y= a.X, 4 
4 CZ5X5, com A, = 2 » . . . , (1$ = j.] 

61. O Exercício 26 introduziu as variáveis aleatórias X e 7, 
número de carros e de ônibus, respectivamente, trans- 
portados por uma balsa em uma única viagem. A fmp 
conjunta de X e Y é dada na tabela do Exercício 7. 
Demonstra-se com facilidade que X e Y são inde- 
pendentes. 

a. Calcule o valor esperado, a variância e o desvio 
padrão do número total de veículos em uma única 
viagem. 

b. Se cada carro pagar um pedágio de US$ 3 e cada 
ônibus de US$ 10, calcule o valor esperado, a va- 
riância e o desvio padrão da receita resultante de 
uma única viagem. 

62. A fabricação de um componente requer três operações 
diferentes de usinagem. O tempo de usinagem de cada 
operação possui distribuição normal e os três tempos 
são independentes um do outro. Os valores médios são 
15, 30 e 20 min, respectivamente, e os desvios padrão 
são 1, 2 e 1,5 min, respectivamente. Qual é a probabi- 
lidade de a usinagem levar no máximo 1 hora para pro- 
duzir um componente selecionado aleatoriamente? 

63. Consulte o Exercício 3. 

a. Calcule a covariância entre X, = o número de clien- 
tes na caixa expressa e X 2 = o número de clientes na 
caixa superexpressa. 

b. Calcule V(X, 4 X 2 ). Como este valor se compara a 
V(X,) 4 V(X 2 )? 

64. Suponha que seu tempo de espera por um ônibus, de 
manhã, seja uniformemente distribuído em [0,8], 
enquanto à noite, é uniformemente distribuído em 
[0, 10] independente do tempo de espera pela manhã. 

a. Se você tomar o ônibus toda manhã e toda noite por 
uma semana, qual é seu tempo de espera total? (5«- 
gestão : Defina as vas X„..., X, 0 e use uma regra de 
valor esperado.) 

b. Qual é a variância do seu tempo de espera total? 

c. Quais são o valor esperado e a variância da difere 
entre os tempos de espera pela manhã e à noite em 
um dia? 
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d. Quais são o valor esperado e a variância da diferença 
entre o tempo de espera total pela manhã e o tempo de 
espera total à noite, durante uma semana especifica? 

65. Suponha que, quando o pH de certo composto químico 
for 5,00, o pH medido por um aluno iniciante de quí- 
mica selecionado ao acaso é uma variável aleatória com 
média 5,00 e desvio padrão 0,2. Um grande lote do com- 
posto é subdividido e uma amostra foi dada a cada aluno 
do laboratório da manhã e do laboratório da tarde. Seja 
X = pH médio determinado pelos alunos da manhã e 
Y = o pH médio determinado pelos alunos da tarde. 

a. Se o pH for uma variável normal e houver 25 alunos 
em cada laboratório, calcule P(- 0,1 < X - Y < 0,1). 
(Sugestão: X - Yé uma combinação linear de variá- 
veis normais, portanto, é normalmente distribuída. 
Calcule /Jbx-T e o^_p.) 

b. Se há 36 alunos em cada laboratório, mas as deter- 
minações do pH não são consideradas normais, cal- 
cule (aproximadamente) P(- 0,1 <X — T<0,1). 

66. Se duas cargas são aplicadas a uma viga em balanço, 
conforme mostra o desenho a seguir, o momento fletor 
em 0 devido às cargas é a,X, 4- a 2 X 2 . 
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a. Suponha que X, e X 2 sejam vas independentes com 
médias de 2 e 4 kips / 2000 e 4000 lb, respectiva- 
mente, e desvios padrão de 0,5 e 1,0 kip / 500 e 100 
lb, respectivamente. Se a x = 5 ft / 1,52 mea 2 = 10 
ft / 3,04 m, qual é o momento fletor esperado e qual 
é o seu desvio padrão? 

b. Se X, e X 2 são normalmente distribuídos, qual é a pro- 
babilidade de o momento fletor exceder 75 kip-ft? 

c. Suponha que as posições das duas cargas sejam va- 
riáveis aleatórias. Representando-as por A ] e A : , as- 
suma que essas variáveis tenham médias de 5 ft e 10 ft, 
respectivamente, que cada uma tenha desvio padrão de 
0,5 e que todos os A , s e X,s sejam independentes uns 
dos outros. Qual é o momento esperado, agora? 

d. Para a situação da parte (c), qual é a variância do 
momento fletor? 

e. Se a situação for a descrita na parte (a), exceto pelo 
fato de que Corr(X,, X 2 ) = 0,5 (de modo que as duas 
cargas não sejam independentes), qual é a variância 
do momento fletor? 

67. Um pedaço de cano de PVC será colocado dentro de 
outro pedaço. O comprimento do primeiro pedaço é 
distribuído normalmente com valor médio de 20 pol 
e desvio padrão de 0,5 pol. O comprimento do segundo 
pedaço é uma va normal com média e desvio padrão de 
15 pol e 0,4 pol, respectivamente. O valor da super- 
posição é distribuído normalmente com valor médio de 
1 pol e desvio padrão de 0,1 pol. Assumindo que os 
comprimentos e o valor da superposição sejam inde- 


pendentes um do outro, qual é a probabilidade de o 
comprimento total após a inserção estar entre 34,5 pol 
e 35 pol? 

68. Dois aviões estão voando na mesma direção em corre- 
dores paralelos adjacentes. No tempo t = 0, o primeiro 
avião está 10 km à frente do segundo. Suponha que a 
velocidade do primeiro (km/h) seja distribuída normal- 
mente com média de 520 e desvio padrão de 10, e que 
a velocidade do segundo avião também seja normal- 
mente distribuída com média e desvio padrão de 500 e 
10, respectivamente. 

a. Qual é a probabilidade de, após 2 h de vôo, o se- 
gundo avião não ter alcançado o primeiro? 

b. Determine a probabilidade de os aviões estarem 
separados por no máximo 10 km após 2 h. 

69. Três estradas diferentes se encontram na entrada de uma 
determinada rodovia. Suponha que durante um período 
de tempo estabelecido, o número de carros que vêm de 
cada estrada para a rodovia seja uma variável aleatória, 
com valor esperado e desvio padrão dados na tabela. 



Estrada 1 

Estrada 2 Estrada 3 

Valor esperado 

800 

1000 600 

Desvio padrão 

16 

25 18 


a. Qual é o número total esperado de carros que entram 
na rodovia nesse ponto durante o período? (Suges- 
tão: represente por X, = o número da estrada /.) 

b. Qual é a variância do número total de carros que en- 
tram? Você fez alguma hipótese sobre a relação 
entre os números de carros nas diferentes estradas? 

c. Com X, representando o número de carros que en- 
tram da estrada i durante o período, suponha que 
Cov(X,, X 2 ) = 80, Cov(X„ X 3 ) = 90, e Cov(X 2 , X 3 ) = 
100 (de modo que os três fluxos de trânsito não se- 
jam independentes). Calcule o número total espera- 
do de carros que entram e o desvio padrão do total. 

70 . Suponha que tomemos uma amostra aleatória de tama- 
nho n de uma distribuição contínua que possui mediana 
0, de modo que a probabilidade de qualquer observação 
ser positiva seja de 0,5. Agora, desprezamos os sinais 
das observações, classificamo-nas da menor para a 
maior em valor absoluto e, então, representamos por 
W = soma das classificações das observações que têm 
sinal positivo. Por exemplo: se as observações forem 
-0,3, +0,7, +2,1, e -2,5, então as classificações das ob- 
servações positivas serão 2 e 3, assim, W = 5. No Capí- 
tulo 15, W será denominada estatística de postos de 
Wilcoxon. W pode ser representada como segue: 

W = 1 • Y x + 2 • Y 2 + 3 • Y 3 + • • • + n • Y n 

n 

i=l 

onde os Y t s são vas de Bernoulli independentes, cada 
uma com p = 0,5 (Y t = 1 corresponde à observação 
com classificação i positiva). Calcule os dados a seguir: 
a. E(Y;) e, então, E(W ), usando a equação para W [Sw- 
gestão: a soma dos n primeiros inteiros positivos é 
n(n + l)/2.] 
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b. V(Y.) e, então V(W) [ Sugestão : a soma dos quadra- 
dos dos n primeiros inteiros positivos é n(n + 1) 
(2/i + l)/6.] 

71. No Exercício 66, o peso próprio da viga contribui para 
o momento fletor. Assuma que a viga seja de espessura 
e densidade uniformes, de modo que a carga resultante 
seja distribuída uniformemente. Se o peso da viga for 
aleatório, a carga resultante do peso também será; re- 
presente essa carga por W (kip-ft). 

a. Se a viga tem 12 pés de comprimento, W tem média 
de 1 ,5 e desvio padrão de 0,25 e as cargas fixas são 
as descritas na parte (a) do Exercício 66, quais são o 
valor esperado e a variância do momento fletor? 
( Sugestão : se a carga, devido à viga, fosse w kip-pé, 
a contribuição para o momento fletor seria w x dx.) 

b. Se as três variáveis (X,, X 2 , e W) são normalmente 
distribuídas, qual é a probabilidade de o momento 
fletor ser de no máximo 200 kip-ft? 

72. Sou responsável por três tarefas no prédio adminis- 
trativo. Seja X, = o tempo que leva a /-ésima tarefa (i = 
1 , 2, 3), e X 4 = o tempo total, em minutos, que eu perco, 
andando pelo prédio e entre cada tarefa. Suponha que 
os XjS sejam independentes, normalmente distribuídos, 
com as seguintes médias e desvios padrão: /z, = 15, 
<r x = 4, /í 2 = 5 , 02 = 1, Ms = 8, cr 3 = 2, /x* = 12, a 4 = 3. 
Pretendo sair do escritório exatamente às 10 h e deixar 
um bilhete na porta, dizendo: “Retomarei às t h”. A que 


horas t devo escrever, se quiser que a probabilidade da 
minha chegada depois de t seja 0,01? 

73. Suponha que a resistência de tração esperada do aço 
tipo A seja 105 ksi e que o desvio padrão da resistência 
de tração seja 8 ksi. Para o aço tipo B, suponha que a 
resistência de tração esperada e o desvio padrão da re- 
sistência de tração sejam 100 ksi e 6 ksi, respectiva- 
mente. Seja X = a resistência de tração média defuma 
amostra aleatória de 40 espécimes tipo A, e por Y = a 
resistência de tração média de uma amostra aleatória de 
35 espécimes tipo B. 

a. Qual é a distribuição aproximada de X? De_T? 

b. Qual é a distribuição aproximada de X - Y1 Justi- 
fique sua resposta. 

c. Calcule (aproximadamente) P(— 1 < X - Y < 1). 

d. Calcule P(X — Y ^ 10). Se realmente observou 
X — Y ^ 10, você duvidaria que /z, — /Zj = 5? 

74. Em uma área que possui solo arenoso, foram plantadas 
50 árvores pequenas de um determinado tipo e outras 50 
foram plantadas em uma área de solo argiloso. Sejam 
X = número de árvores plantadas no solo arenoso que 
sobrevivem 1 ano, e Y = número de árvores plantadas 
no solo argiloso que sobrevivem 1 ano. Se a probabili- 
dade de a árvore plantada no solo arenoso sobreviver 1 
ano for de 0,7 e de sobreviver 1 ano no solo argiloso for 
de 0,6, calcule uma aproximação a P( - 5 < X - Y < 5) 
(não se preocupe com a correção de continuidade). 


I Exercícios Suplementares (75-94) 

75. Um restaurante serve três pratos ao preço fixo de US$ 

12, US$ 15 e US$ 20. Para um casal selecionado alea- 
toriamente que janta nesse restaurante, sejam X = 
custo do jantar do homem ef = custo do jantar da mu- 
lher. A fmp conjunta de X e Y é dada na tabela a seguir: 


y 


P(x, y ) 

12 

15 

20 

12 

(X05\ 

0,05 

0,10 

x 15 

0,05 


0,35 

20 

0 

0,20 



a. Calcule as fmps marginais de X e Y 

b. Qual é a probabilidade de o jantar do homem e da 
mulher custar no máximo US$ 15 cada? 

c. X e Y são independentes? Justifique sua resposta. 

d. Qual é o custo total esperado do jantar para as 
duas pessoas? 

e. Suponha que. quando um casal abre biscoitos da sorte 
no final da refeição, encontra a mensagem “Vocês re- 
ceberão de volta a diferença entre o custo da refeição 
mais cara e o da mais barata que escolheram”. Quanto 
o restaurante espera devolver? 

76. Na estimativa de custo, o preço total de um projeto é a 
soma dos gastos das tarefas componentes. Cada custo 
é uma variável aleatória com uma distribuição de 
probabilidade. É costume obter informações sobre a 


distribuição do custo total, somando-se características I 
das distribuições de custo do componente individual: 
isso é chamado procedimento de roll-up. Por exemplo: 
£(X, + • • • + X n ) = E(X.) + • • • + £(X„), assim, o 
procedimento de roll-up é válido para o custo médio. 
Suponha que existam duas tarefas componentes e que 
X, e X 2 sejam variáveis aleatórias independentes e nor- I 
malmente distribuídas. O procedimento de roll-up é 
válido para o 75 Q percentil? Isto é, o 75 c percentil da I 
distribuição de X, +X 2 éo mesmo que a soma dos 75 6 
percentis das duas distribuições individuais? Se nào. I 
qual é a relação entre o percentil da soma e a soma dos I 
percentis? Para quais percentis o procedimento de roll - 1 
up é válido, nesse caso? 

77. Uma loja de comida saudável possui duas marcas dife- I 
rentes de um certo tipo de grão. Sejam X = quantidade I 
(lb) da marca A em estoque e Y = quantidade da marca I 
B em estoque. Suponha que a fdp conjunta de X e Y seja I 

ÍJbcy jc > 0, y > 0, 20 < jc + y < 30 
J U, > ) I q casQ contr ário 

a. Desenhe a região de densidade positiva e determine* 
o valor de k. 

b. X e Y são independentes? Responda, encontrando I 
primeiro a fdp marginal de cada variável. 
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c. Calcule P(X + 25). 

d. Qual é a quantidade total esperada desse grão em 
estoque? 

e. Calcule Cov(X, Z) e Corr(X, Y). 

f. Qual é a variância da quantidade total de grão em 
estoque? 

78. Sejam X,, X 2 , ... , X„ variáveis aleatórias que representam 
n propostas independentes de um item que está à venda. 
Suponha que cada X, seja uniformemente distribuído no 
intervalo [100, 200]. Se o vendedor vende pela oferta 
maior, quanto pode esperar ganhar com a venda? [ Su- 
gestão : seja Y = max(X,, X 2 ,..., X„). Encontre primeiro 
F Y (y) y observando que Y<y se e somente se cada X, 
for < y. Então, obtenha a fdp e £00.] 

79. Suponha que, para certo indivíduo, a ingestão de calo- 
rias no café da manhã seja uma variável aleatória com 
valor esperado de 500 e desvio padrão de 50. a ingestão 
de calorias no almoço seja aleatória com valor esperado 
de 900 e desvio padrão de 100, e a ingestão de calorias 
no jantar seja uma variável aleatória com valor espe- 
rado de 2000 e desvio padrão de 180. Assumindo que 
os consumos nas diferentes refeições sejam indepen- 
dentes, qual é a probabilidade de a ingestão média 
diária de calorias durante o ano seguinte (365 dias) ser 
de no máximo 3500? [Sugestão: sejam X,, Y„ e Z, as três 
ingestões de calorias no dia i. Então, a ingestão total é 
dada por I(X, 4- Y, + Z,).] 

80. 0 peso médio da bagagem de um passageiro da classe 
turística selecionado aleatoriamente, que voa entre duas 
cidades em uma determinada linha aérea, é 40 lb, e o 
desvio padrão é 10 lb. A média e o desvio padrão para 
um passageiro da classe executiva são 30 lb e 6 lb, 
respectivamente. 

a. Se há 12 passageiros na classe executiva e 50 na clas- 
se turística em certo vôo. quais são o valor esperado 
e o desvio padrão do peso total da bagagem ? 

b. Se os pesos individuais da bagagem forem vas inde- 
pendentes e normalmente distribuídas, qual é a pro- 
babilidade de o peso total da bagagem ser de no 
máximo 2500 lb? 

81. Vimos que, se £(X,) = £(X 2 ) = ••* = £(XJ = p,, en- 
tão, £(X, + • • • + X„) = ii/ji. Em algumas aplicações, o 
número de X ; s considerados não é um número fixo //. 
mas uma va N. Por exemplo: sejam N = o número de 
componentes levados a uma oficina em certo dia, e A', o 
tempo de reparo do i-ésimo componente. Então, o 
tempo de reparo total é X, + X 2 4- • • • 4- X v . a soma de 
um número aleatório de variáveis aleatórias. Quando N 
for independente dos X,s, pode-se mostrar que 

£(X, + * • • + X N ) = E(N) • m 

a. Se o número esperado de componentes levados em 
um dia for 10 e o tempo de conserto esperado de um 
componente enviado aleatoriamente for 40 min, qual 
é o tempo total esperado de conserto dos compo- 
nentes enviados em um dia qualquer? 


b. Suponha que certo tipo de componente chegue para 
conserto, de acordo com um processo de Poisson, 
com um índice de 5 por hora. O número esperado de 
defeitos por componente é 3,5. Qual é o valor espe- 
rado do número total de defeitos em componentes 
enviados para conserto durante um período de 4 ho- 
ras? Certifique-se de indicar como sua resposta se 
desenvolve a partir do resultado geral dado. 

82. Suponha que a proporção de eleitores rurais em um de- 
terminado estado que favorece certo candidato a gover- 
nador seja de 0,45 e que a proporção de eleitores 
urbanos e suburbanos que o favorecem seja de 0,60. Se 
uma amostra de 200 eleitores rurais e 300 urbanos e 
suburbanos for obtida, qual será a probabilidade apro- 
ximada de pelo menos 250 desses eleitores favorecerem 
o candidato? 

83. Seja p o pH real de um composto químico. Será feita uma 
seqüência de n determinações independentes do pH da 
amostra. Suponha que o pH de cada amostra seja uma 
variável aleatória com valor esperado p e desvio padrão 
0,1. Quantas determinações serão necessárias se quiser- 
mos que a probabilidade da média amostrai esteja entre 
0,02 do pH real seja de no mínimo 0,95? Que teorema 
justifica seu cálculo de probabilidade ? 

84. Se a quantidade de refrigerante que consumo em certo 
dia é independente do consumo em qualquer outro dia 
e é normalmente distribuída com p = 13 oz e tz = 2, e 
se eu atualmente tenho duas caixas com seis garrafas de 
16 oz, qual é a probabilidade de eu ainda ter refrige- 
rante ao fim de duas semanas (14 dias)? 

85. Consulte o Exercício 58 e suponha que os X,s sejam in- 
dependentes com cada um tendo distribuição normal. 
Qual é a probabilidade de o volume total embarcado ser 
de no máximo 100.000 pé 3 ? 

86. Um aluno tem uma aula que supostamente termina às 9 
h e outra que começa às 9hl0. Suponha que a hora de 
término real da aula das 9 h seja uma va normalmen- 
te distribuída X, com média de 9h02 e desvio padrão de 
1,5 min e que a hora de início da aula seguinte também 
seja uma va normalmente distribuída X 2 com média de 
9hl0 e desvio padrão de 1 min. Suponha também que o 
tempo necessário para sair de uma sala e chegar à outra 
seja uma va normalmente distribuída X, com média de 
6 min e desvio padrão de 1 min. Qual é a probabilidade 
de o aluno chegar à segunda aula antes de ela começar? 
(Assuma independência de X,, X 2 , e X 3 , que é razoável 
se o aluno não prestar atenção à hora do término da 
primeira aula.) 

87. a. Use a fórmula geral da variância de uma combinação 

linear para escrever uma expressão para V(aX + Y). 
Então, seja a = cz/o*, e mostre que p > - 1 . [ Su- 
gestão: a variância sempre é ^ 0, e Cov(X, Y) = 
&x * * p ] 

b. Considerando que V(aX - X), conclua que p < 1. 

c. Use o fato de V(W) = 0 somente se W for uma cons- 
tante para mostrar que p = 1 somente se Y = aX + b. 
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88. Suponha que a pontuação verbal X e a pontuação quan- 
titativa X de um indivíduo escolhido aleatoriamente em 
um exame de aptidão administrado nacionalmente te- 
nham fdp conjunta. 


f(x, y) = 


|( 2 * + 3 y) 
0 


0 < l,0<y< 1 

caso contrário 


Você é solicitado a fornecer uma previsão / da pontua- 
ção total do indivíduo X 4- Y. O erro de previsão é o 
erro médio quadrado E[(X 4 - X — tf]. Que valor de t 
minimiza o erro de previsão? 


89. a. X, tem distribuição qui-quadrado com parâmetro y, 

(veja a Seção 4.4), X 2 é independente de X, e tem 
uma distribuição qui-quadrado com parâmetro v 2 . 
Use a técnica do Exemplo 5.21 para mostrar que 
X, 4- X 2 tem uma distribuição qui-quadrado com 
parâmetro 4- v 2 . 

b. No Exercício 65 do Capítulo 4, você foi solicitado a 
mostrar que, se Z é uma va normal-padrão, então Z 2 
possui uma distribuição qui-quadrado com v= 1. 
Sejam Z„ Zj, ... , Z„, as vas normais-padrão indepen- 
dentes de n. Qual é a distribuição de Z] + 
• • • 4- Z 2 ? Justifique sua resposta. 

c. Seja X,, ... , X„ uma amostra aleatória de uma dis- 
tribuição normal com média /x e variância cr 2 . Qual 
é a distribuição da soma Y = 5X, [(X, — /x)/cr] 2 ? 
Justifique sua resposta. 

90. a. Mostre que Cov(X, Y 4- Z) = Cov(X, Y) 4- Cov(X, Z). 
b. Sejam X, e X 2 as pontuações verbal e quantitativa em 

um exame de aptidão, e X, e Y 2 as pontuações corres- 
pondentes em outro exame. Se Cov(X,, X,) = 5, 
Cov(X„ X 2 ) = 1, Cov(X 2 , X.) = 2, e Cov(X 2 , X 2 ) = 
8, qual é a covariância entre as duas pontuações to- 
tais X, + X 2 e X, 4- X : ? 


91. Um espécime de rocha de uma área específica é sele- 
cionado aleatoriamente e pesado duas vezes. Represente 
por W o peso real e por X, e X 2 os dois pesos medidos. 
Então. X, = W 4- £, e X 2 = W 4- £ 2 , onde £, e E 2 são 
dois erros de medição. Suponha que os E, s sejam inde- 
pendentes entre si e de We que V(£,) = V(E 2 ) = ct 2 e . 

a. Expresse por p o coeficiente de correlação entre os 
dois pesos medidos X, e X 2 , em termos de cr£, a 
variância do peso real, e por a variância do 
peso medido. 

b. Calcule p quando a w = 1 kg e <t e — 0,01 kg. 

92. Sejam A a porcentagem de um elemento de um es- 
pécime de rocha selecionado aleatoriamente, e B a por- 


centagem de um segundo elemento desse mesmo es- 
pécime. Suponha que D e E sejam erros de medição ao 
determinar os valores de A e #, de modo que os 
valores medidos sejam X = A 4- D e X = Z? 4- E, res- 
pectivamente. Assuma que os erros de medição sejam 
independentes um do outro e dos valores reais, 
a. Mostre que 

Corr(X, X) 

= Cont4, B) • VCorr(X„ X 2 ) • VcõrrÕvT) 


onde X, e X 2 são medições duplas do valor de A e X, 
e X 2 são definidos analogamente com relação a B. 
Que efeito a presença de erro de medição tem sobre 
a correlação? 

b. Qual é o valor máximo de Corr(X, X) quando 
Corr(X„ X 2 ) = 0,8100 e Corr(X„ X 2 ) = 0,9025? Isso 
é preocupante? 

93. Sejam X,,..., X n vas independentes com valores médios 
/x,,..., /x„ e variâncias o*?,..., o* 2 . Considere uma função 
/i(jc„..., jc„) e use-a para definir uma nova va X = 
A(X„.. m X„). Sob condições bastante gerais sobre a 
função h, se os cr,s forem pequenos em relação aos 
correspondentes /x, s, pode-se mostrar que EíX)^ 
/O e 

dh 2 3/í 2 


onde cada derivada parcial é avaliada em (jc„..., jcJ = 
(/x,, . . . , /x„). Suponha que três resistores com resis- 
tências X,, X 2 , X 3 sejam conectados em paralelo a uma 
bateria com voltagem X 4 . Então, pela lei de Ohm, a 
corrente é 





Sejam /x, = 10 ohms, a, = 1,0 ohm, /x 2 = 15 ohms, 
a 2 = 1,0 ohm, p, 3 = 20 ohms, cr ? = 1,5 ohms, /x 4 = 
120 V, = 4,0 V. Calcule o valor esperado aproxi- 
mado e o desvio padrão da corrente (sugerido por “Ran- 
dom Samplings” (Amostras Aleatórias) CHEMTECH , 
1984, p. 696-697). 

94. Uma aproximação mais precisa de £[/z(X,,..., XJ] do 
Exercício 93 é 


1 3 2 h 1 &h 

^ ,+ r f iw> + "' + 2‘ r; i«) 


Calcule-a para X = /z(X,, X 2 , X 3 , X 4 ), dado no Exercício 
93, e compare-a ao termo principal A(/x lf ..., /xJ. 
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Estimativa 

Pontual 


Introdução 

Dado um parâmetro de interesse, como a média da população n ou proporção da po- 
pulação p, o objetivo da estimativa pontual é usar uma amostra para calcular um número 
que represente, de certo modo, uma boa previsão do valor real do parâmetro. 0 número 
resultante é chamado estimativa pontual. Na Seção 6.1, apresentamos alguns conceitos 
gerais de estimativa pontual. Na Seção 6.2, descrevemos e ilustramos dois métodos im- 
portantes para se obter estimativas pontuais: o método dos momentos e o método da 
máxima verossimilhança. 


6.1 Alguns Conceitos Gerais 
sobre Estimativa Pontual 

A inferência estatística é quase sempre direcionada à obtenção de algum tipo de conclusão sobre um ou mais 
parâmetros (características da população). O processo requer que o pesquisador obtenha dados de amostras de 
cada população em estudo. As conclusões baseiam-se, então, nos valores calculados das várias quantidades da 
amostra. Por exemplo: seja (um parâmetro) a tensão média de quebra real das conexões do fio usado na união 
dos wafers semicondutores. Uma amostra aleatória de n = 10 conexões pode ser feita e a tensão de quebra de 
cada uma, determinada, resultando em tensões observadas x u x 2 ,.-. , x l0 . A tensão média de quebra da amostra x 
é. então, usada para tirar conclusões sobre o valor de fi. De forma semelhante, se o 2 for a variância da dis- 
tribuição da tensão de quebra (variância da população, outro parâmetro), o valor da variância da amostra s 2 é 
usado para inferir alguma coisa sobre a 2 . 

Ao discutir conceitos gerais e métodos de inferência, é conveniente definir um símbolo genérico para o 
parâmetro de interesse. Usaremos a letra grega 6 para esse fim. O objetivo da estimativa pontual é selecionar um 
único valor, com base nos dados da amostra, que represente um valor sensato para 0. Suponha, por exemplo, que 
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o parâmetro de interesse seja /x, a vida útil média real de certo tipo de pilhas. Uma amostra aleatória de n = 3 
pilhas resulta nos valores de vida útil observados (horas) x, = 5,0, x 2 = 6,4, x 3 = 5,9. O valor calculado da vida 
útil média amostrai é x = 5,77, e é razoável considerar 5,77 um valor bastante plausível de /x — nossa “melhor 
previsão” para o valor de p, com base nas informações disponíveis da amostra. 

Suponha que queiramos estimar um parâmetro de uma única população (por exemplo, /x ou cr) com base 
em uma amostra aleatória de tamanho n. Lembre-se do capítulo anterior que, antes de os dados estarem 

disponíveis, as observações da amostra devem ser consideradas como variáveis aleatórias (vas) X,, X 2 X n . 

Acontece que qualquer função dos X,s - isto é, qualquer estatística - como a média amostrai X ou o desvio 
padrão amostrai S também é uma variável aleatória. O mesmo acontece se os dados disponíveis consistirem de 
mais de uma amostra. Por exemplo: podemos representar as resistências à tração de m espécimes tipo 1 e de n 

espécimes tipo 2 por X, X m e Y Y„, respectivamente. A diferença entre as duas resistências médias 

amostrais X - Yé a estatística natural para fazer inferências sobre - p 2 , a diferença entre as resistências mé- 
dias da população. 


DEFINIÇÃO 


Uma estimativa pontual de um parâmetro 9é um único número que pode ser considerado 
um valor sensato para 0. Obtém-se uma estimativa pontual selecionando uma estatística 
adequada e calculando seu valor pelos dados da amostra. A estatística selecionada é 
chamada estimador pontual de 0. 


No exemplo da pilha, o estimador usado para obter a estimativa pontual de p foi X, e a estimativa pontual 
de fx foi 5,77. Se os três valores de vida útil observados forem x, = 5,6, x 2 = 4,5, e x 3 = 6,1, o uso do estimador i 
X teria resultado na estimativa x = (5,6 + 4,5 + 6, 1 )/3 = 5,40. O símbolo 6 é habitualmente usado para repre- 
sentar como o estimador de 0 como a estimativa pontual resultante de uma amostra dada. 1 Dessa forma, p = X 
é lido como “estimador pontual de p é a média amostrai X”. A afirmativa “a estimativa pontual de p é 5.77” é 
escrita resumidamente como fx = 5,77. Observe que, ao escrever 0 = 72,5, não há indicação de como a 
estimativa pontual foi obtida (que estatística foi usada). Assim, recomenda-se que o estimador e a estimativa re- 
sultante sejam descritos. 

Exemplo 6.1 

Um fabricante de automóveis desenvolveu um novo tipo de pára-choque que supostamente absorve impacto» 
com menos danos que os pára-choques anteriores. O fabricante usou pára-choques novos em uma sequência de 
25 colisões controladas contra uma parede, cada uma a 10 mph, usando um de seus modelos de carro compacto. 
Seja X = número de colisões que resultam em danos imperceptíveis ao automóvel. O parâmetro a ser estima^ 
é p = proporção de todas as colisões que não provocam danos [de maneira alternativa, p = P{ nenhum dano em 
uma única colisão)]. Se X observado é x = 15, o estimador e a estimativa mais razoáveis são 

X x 15 

estimador p = — estimativa = — = — — = 0,60 ■ 

n n 25 

Se, para cada parâmetro de interesse houvesse somente um estimador pontual razoável, não haveria muito o 
que discutir sobre a estimativa pontual. Na maioria dos problemas, entretanto, há mais de um estimador razoável. 

Exemplo 6.2 

Reconsidere as 20 observações que seguem na voltagem dielétrica de quebra de peças de resina de epóxi in 
duzida primeiro no Exemplo 4.29 (Seção 4.6). 

24,46 25,61 26,25 26,42 26,66 27,15 27,31 27,54 27,74 27,94 

27,98 28,04 28,28 28,49 28,50 28,87 29,11 29,13 29,50 30,88 


Seguindo as notações anteriores, poderíamos usar 0 (O maiusculo) para o estimador, mas é trabalhoso escrevê-lo. 
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0 padrão no gráfico de probabilidade normal mostrado é bastante reto; assim, assumimos que a distribuição 
da voltagem de quebra é normal com valor médio fi. Em virtude de as distribuições normais serem simétricas, 
fi também é a mediana da vida útil da distribuição. As observações dadas são, então, assumidas como o resul- 
tado de uma amostra aleatória X,, X 2 ,..., X 20 dessa distribuição normal. Considere os seguintes estimadores e es- 
timativas resultantes para fi: 

a. Estimador = X, estimativa = x = 'Zxjn = 555,86/20 = 27,793 

b. Estimador = X, estimativa = x = (27,94 + 27,98)/2 = 27,960 

c. Estimador = [min(X,) + max(X,)]/2 = a média das duas vidas úteis extremas, estimativa = [min(x,) + 
max(x,)]/2 = (24,46 + 30,88)/2 = 27,670 

d. Estimador = X wl0) , a média aparada de 10% (despreze os 10% menores e maiores da amostra e calcule 
a média), 

estimativa = 3c lri , m 

= 555.86 - 24.46 - 25.61 - 29,50 - 30.88 
16 

= 27,838 

Cada um dos estimadores (a)-(d) utiliza uma medida diferente do centro da amostra para estimar /x. Qual 
das estimativas está mais próxima do valor real? Não podemos responder sem saber o valor real. Uma pergunta 
que pode ser respondida é: “Que estimador, quando usado em outras amostras dos X,s, tenderá a produzir esti- 
mativas mais próximas do valor real?” Consideraremos em breve esse tipo de pergunta. ■ 

F Exemplo 6.3 

No futuro próximo haverá um interesse crescente no desenvolvimento de ligas à base de Mg de baixo custo para 
diversos processos de fundição. Por isso, é importante ter maneiras práticas de determinar as várias propriedades 
mecânicas de tais ligas. O artigo “On the Development of a New Approach for the Determination of Yield 
Strength in Mg-based Alloys” (Light Metal Age, out. 1998, p. 50-53) propôs um método ultra-sônico para esse 
fim. Considere a seguinte amostra de observações no módulo de elasticidade (GPa) de espécimes da liga AZ91D 
de um processo de fundição: 


44,2 43,9 44,7 44,2 44,0 43,8 


44,6 


43,1 


Assuma que essas observações sejam o resultado de uma amostra aleatória X,,..., X 8 da distribuição da po- 
pulação de módulo elástico sob tais circunstâncias. Queremos estimar a variância da população a 2 . Um esti- 
mador natural é a variância amostrai: 

= = IXj-dX) 7. 

n — 1 n — 1 


A estimativa correspondente é 


fr 2 = s 2 = Z-rr ~ (Ixf/S = 15.533.79 - (352,5) 2 /8 


= 0,25125 «0,251 


A estimativa de <t seria, então, à = s = V0,25125 = 0,501. 

Um estimador alternativo seria resultado do uso do divisor n em vez de n — 1 (isto é, o desvio elevado ao 

quadrado médio): 

Z(X, - X) 2 , 1,75875 

(j = estimativa = = 0,220 

n 8 

Indicaremos em breve o porquê de muitos estatísticos preferirem S 2 ao estimador com divisor n. ■ 
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No melhor dos mundos, podemos encontrar um estimador 0 para o qual 6=0 , sempre. Entretanto, 6 é uma 
função da amostra dos X,s, portanto, é uma variável aleatória. Para algumas amostras, 9 produzirá um valor maior 
que 0, enquanto, para outras, 0 subestimará 0. Se escrevermos 

0=0 + erro de estimativa 

então, um estimador preciso seria aquele que resultasse em pequenos erros de estimativa, de modo que os va- 
lores estimados estarão próximos do valor real. Um estimador que possui as propriedades de não-tendencio- 
sidade e variância mínima geralmente será preciso nesse sentido. 


Estimadores Não-téndenciosos 


Suponha que tenhamos dois instrumentos de medidas: um foi calibrado com precisão, mas o outro fornece sis- 
tematicamente leituras menores do que o valor real que está sendo medido. Quando cada instrumento for uti- 
lizado repetidas vezes no mesmo objeto devido ao erro de medição, as medições observadas não serão idênticas. 
Entretanto, as medições produzidas pelo primeiro instrumento serão distribuídas com relação ao valor real de tal 
maneira que, na média, esse instrumento mede o que se propõe a medir; assim, é chamado de instrumento não- 
tendencioso. O segundo instrumento produz observações que têm um componente de erro sistemático ou desvio. 


DEFINIÇÃO 


Um estimador pontual 0 é considerado um estimador não-tendencioso de 0 se E(0) = 6 
para cada valor possível de 0. Se 0 não for não-tendencioso, a diferença E(0) — 0é 
chamada desvio ou tendenciosidade de 0. 


Isto é, 0 é não-tendencioso se sua distribuição de probabilidade (isto é, amostragem) estiver sempre “cen- I 
trada” no valor real do parâmetro. Suponha que 0 seja um estimador não-tendencioso; então, se 0 = 100, a dis- I 
tribuição amostrai de 0 está centralizada em 100; se 0 = 27,5, então, a distribuição amostrai de 0 está centrada I 
em 27,5 e assim por diante. A Figura 6. 1 ilustra as distribuições de diversos estimadores tendenciosos e não-ten- I 
denciosos. Observe que “centrado”, aqui, significa que o valor esperado, não a mediana, da distribuição de0é I 
igual a 0. 



(ou desvio) de B\ (ou desvio) de B\ 

Figura 6.1 As fdps de um estimador tendencioso Ó, e um estimador não-tendencioso 0 2 , 
para o parâmetro 0 


Talvez seja necessário saber o valor de 0 (caso em que a estimativa é desnecessária) para ver se 0 é não- I 
tendencioso. Esse geralmente não é o caso, pois muitas vezes o argumento de um valor esperado geral pode ser I 
usado para verificar a não-tendenciosidade. 

No Exemplo 6.1, a proporção amostrai Xln foi usada como um estimador de p, onde X , o número de suces- I 
sos da amostra, tinha uma distribuição binomial com parâmetros n e p. Assim, 

E{p) = £Í-) = - E(X) = - (np) = p 
\n ) n n 


PROPOSIÇÃO 


Quando X é uma va binomial com parâmetros n e /?, a proporção amostrai p = X/n é um 
estimador não-tendencioso de p. 
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Qualquer que seja o valor real de p, a distribuição do estimador p estará centrada no valor real. 

Exemplo 6.4 

Suponha que X, tempo de reação a certo estímulo, possua distribuição uniforme no intervalo de 0 a um limite 
superior desconhecido 9 (assim, a função de densidade de X tem formato retangular com altura 1/9 para 0 :< 
x ^ 0). Deseja-se estimar 9 com base em uma amostra aleatória X x , X 2 , ..., X„ de tempos de reação. Uma vez que 
0 é o maior tempo possível em toda a população de tempos de reação, considere como um primeiro estimador o 
maior tempo de reação da amostra: 0, = max(X,, ..., X„). Se n = 5 e x, = 4,2, x 2 = 1,7, x 3 = 2,4, 
x 4 = 3,9, x 5 = 1,3, a estimativa pontual de 9 é 0, = max(4,2, 1,7, 2,4, 3,9, 1,3) = 4,2. 

A não-tendenciosidade implica que algumas amostras produzirão estimativas que excedem 9 e que outras 
produzirão estimativas menores que 9. Caso contrário, 9 possivelmente não poderia ser o centro (ponto de equi- 
líbrio) da distribuição dos 9,. Entretanto, nosso estimador proposto nunca superestimará 9 (o maior valor da 
amostra não pode exceder o maior valor da população) e subestimará 9 , a menos que o maior valor amostrai seja 
igual a 6. Este argumento intuitivo mostra que 0, é um estimador tendencioso. Mais precisamente, pode-se 
demonstrar (veja o Exercício 32) que 



Princípio da Estimação Não-tendenciosa 

Ao escolher dentre diversos estimadores diferentes de 9, selecione um que seja 
não-tendencioso. 


De acordo com esse princípio, deve ser dada preferência ao estimador não-tendencioso 0 2 no Exemplo 6.4 
com relação ao estimador tendencioso 9 ,. Considere agora o problema de se estimar tr 2 . 


PROPOSIÇÃO 




Sejam X„ X 2 , ..., X„ uma amostra aleatória de uma distribuição com média p, e variância 
tr 2 . Então, o estimador 


ã 2 = S 2 = 


lix, - X ) 2 

n - 1 


é um estimador não-tendencioso de cr 2 . 
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Demonstração Para qualquer va Y , V(Y) = EiY 2 ) — [/síF)] 2 , assim, E{Y 2 ) = V(Y) 4 - [£(K)] 2 . Aplicando essa ex- 
pressão em 


S 2 = 


=4r[ Zxl 


(Zx,y 


fornece 


E(S 2 ) = — l — ÍSEíX?) - - £[(I*,) 2 ]] 
n- 11 n J 

= —^~r ÍS( o- 2 + ti?) - - { V(Zx,) + [£(Xx,)] 2 } 

n — 1 [ n 

= — - — íncr 2 4* nfj} — - na 2 — - (n/x) 2 } 
n — 1 [ n n ) 

i 

[na 2 — a 2 ) = a 2 (conforme desejado) 


n - 1 

O estimador que utiliza divisor n pode ser expresso como (n — 1 )S 2 /n, assim. 


4 


(» - 1 )S 2 


n - 1 


E(S 2 ) = 


n - 1 


Esse estimador, portanto, é tendencioso. O desvio é(n — 1 )<r 2 /n — a 2 = -aVrt. Em virtude de o desvio ser 
negativo, o estimador com divisor n tende a subestimar cr 2 , e é por esse motivo que o divisor n — 1 é prefe ' 
por muitos estatísticos (mesmo quando n é grande, o desvio é pequeno e há pouca diferença entre os dois). 

Embora S 2 seja não-tendencioso para cr 2 , S é um estimador tendencioso de sigma (seu desvio é pequeno, a 
menos que n seja bem pequeno). Entretanto, existem outros bons motivos para usar S como um estimador, es- 
pecialmente quando a distribuição da população é normal. Isso ficará mais visível quando discutirmos os inter- 
valos de confiança e os testes de hipóteses nos capítulos seguintes. 

No Exemplo 6.2, propusemos vários estimadores diferentes para a média /x de uma distribuição normal. Se 
houvesse um único estimador não-tendencioso para /x, o problema da estimação seria resolvido usando-se tal 
estimador. Infelizmente, esse não é o caso. 


PROPOSIÇÃO 


Se X,, X 2 ,..„ X„ forem uma amostra aleatória de uma distribuição com média ix, então X é 
um estimador não-tendencioso de /x. Se, além disso, a distribuição for contínua e 
simétrica, então X e qualquer média aparada também serão estimadores não-tendencio- 
sos de fx. 


O fato de X ser não-tendencioso é simplesmente uma reafirmação de uma de nossas regras do valor espfr 
rado: E(X) =fx para cada valor possível de fx (para distribuições discretas e contínuas). A não-tendenciosi 
dos outros estimadores é mais difícil de ser verificada. 

De acordo com essa proposição, apenas o princípio da não-tendenciosidade nem sempre nos permite sele- 
cionar um único estimador. Quando a população em estudo é normal, mesmo o terceiro estimador do Exemp 
6.2 é não-tendencioso, e há muitos outros estimadores não-tendenciosos. Precisamos agora de um meio de sele- 
cionar os estimadores não-tendenciosos. 


Estimadores com Mínima Variância 

Suponha que ê, e è 2 sejam dois estimadores de d, ambos não-tendenciosos. Então, embora a distribuição de cada 
estimador esteja centrada no valor real de 0, as dispersões das distribuições em tomo do valor real pode 
ser diferentes. 
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Princípio da Estimação Não-tendenciosa de Mínima Variância 

Dentre todos os estimadores não-tendenciosos de 0, escolha aquele que tiver variância 
mínima. O 6 resultante é chamado estimador não-tendencioso de mínima variân- 
cia (ENTMV) de 0. 


A Figura 6.2 ilustra as fdps de dois estimadores não-tendenciosos, com 0, tendo variância menor que0 2 . En- 
tão. é mais provável que 0 , produza uma estimativa mais próxima do 0 real do que 0 2 . O ENTMV é, de certo 
modo. dentre todos os estimadores não-tendenciosos, o que produzirá, mais provavelmente, uma estimativa 
próxima de 0 real. 



Figura 6.2 Gráficos das fdps de dois estimadores não-tendenciosos diferentes 


Exemplo 6.5 

Afirmamos no Exemplo 6.4 que, quando X { , .... X„ é uma amostra aleatória de uma distribuição uniforme em 

[0, AJ, o estimador 


0. = ~ ~ * • maxÇY X„) 

n 

é não-tendencioso para 0 (representamos anteriormente esse estimador por 0 2 ). Esse não é o único estimador 
não-tendencioso de 0. O valor esperado de uma va uniformemente distribuída é exatamente o ponto central do 
intervalo de densidade positiva, assim E(X,) = 0/2. Isso implica que E(X) = 0/2 , de onde E(2X) = 0. Isto é, o es- 
timador 0 2 = 2X é não-tendencioso para 0. 

Se X for uniformemente distribuído no intervalo [A, fl], então, V{X) = a 2 = (B — A) 2 / 12. Dessa forma, para 
o nosso caso, V(X,) = 0712, V(X) = <r 2 /n = 07(12 n), e V(0 2 ) = V(2X) = 4V(X) = 07(3 n). Os resultados do 
Exercício 32 podem ser usados para mostrar que V(0,) = 0 2 /[n(n + 2)]. O estimador 0, tem variância menor que 
0; se 3n < n(n + 2) — isso é, se 0 < n 2 — n = n(n — 1). Como n > 1, V(0,) < V(0 2 ), então, 0, é um estimador 
melhor que 0 2 . Métodos mais avançados podem ser usados para mostrar que 0, é o ENTMV de 0 — qualquer 
outro estimador não-tendencioso de 0 tem variância que excede 07 [n(n + 2)]. ■ 

Um dos triunfos da estatística matemática foi o desenvolvimento da metodologia para identificar o ENTMV 
em uma ampla variedade de situações. O resultado mais importante desse tipo para nossos propósitos diz res- 
peito a estimar a média /u de uma distribuição normal. 


TEOREMA 


Sejam X,, ... , X„ uma amostra aleatória de uma distribuição normal com parâmetros fi e 
<j. Então, o estimador fi = X éo ENTMV de fi. 


Quando estamos convencidos de que a população que está sendo amostrada é normal, o resultado diz que 
X deve ser usado para estimar /jl. No Exemplo 6.2, então, nossa estimativa seria x = 27,793. 

Em algumas situações, é possível obter um estimador com pequena tendenciosidade preferível ao melhor 
estimador não-tendencioso. Isso é ilustrado na Figura 6.3. Entretanto, os ENTMVs geralmente são mais fáceis 
de ser obtidos do que o tipo de estimador tendencioso cuja distribuição é ilustrada. 


228 


Probabilidade e Estatística - Editora Thomson 



fdp de ê lt um estimador tendencioso 


fdp de ê 2 , the ENTMV 


d 


Figura 6.3 Um estimador tendencioso que é preferível ao ENTMV 


Algumas Complicações 

O último teorema não afirma que, ao estimar a média da população /x, o estimador X deve ser usado indepen- 
dentemente da distribuição que está sendo amostrada. 


padrão, obteremos uma amostra aleatória X ls X n de n medições de condutividade térmica. Vamos assumir que 
a distribuição da população pertença a um membro de uma das três famílias a seguir: 


A fdp (6.1) é a distribuição normal, (6.2) é denominada distribuição de Cauchy e (6.3) é uma distribui 
uniforme. As três distribuições são simétricas com relação a /x, e, de fato, a distribuição de Cauchy tem o for- 
mato de sino, mas com caudas muito mais pesadas (mais probabilidades distantes) que a curva normal. A dis- 
tribuição uniforme não possui caudas. Os quatro estimadores de /x considerados anteriormente são X , X, X ( 
(a média das duas observações extremas) e X^o), uma média aparada. 

A conclusão mais importante aqui é que o melhor estimador de /x depende crucialmente da distribuição que 
está sendo amostrada. Em particular, 

1. Se a amostra aleatória foi tirada de uma distribuição normal, então X é o melhor dos quatro estimado 
uma vez que possui mínima variância dentre todos os estimadores não-tendenciosos. 

2. Se a amostra aleatória foi tirada de uma distribuição de Cauchy, então XtX e são péssimos estimada 
de /x, enquanto X é relativamente bom (o ENTMV não é conhecido); X é ruim porque é muito sensí 
às observações aberrantes, e as caudas pesadas da distribuição de Cauchy tornam provável a aparr 
de tais observações em qualquer amostra. 


Exemplo 6.6 

Suponha que queiramos estimar a condutividade térmica /x de certo material. Usando técnicas de medição- 


/(*) = 


V27 tct 


e -(x-ti) 2 /(2(r 2 ) _ 00 < x < oo 


( 6 . 1 ) 


+ (* ~ Al) 1 2 ] 


-OO < X < °° 


( 6 . 2 ) 


1 


— C ^ X — fJL ^ C 

caso contrário 


f(x) = < 2c 
0 


( 6 . 3 ) 



distribuição. 



Uma pesquisa estatística recente estabeleceu que, ao estimar um ponto de simetria /jl de uma distri 
ção de probabilidade contínua, a média aparada com proporção de aparagem de 10% ou 20% (de c 
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n- I 


ado indepei 


j de medição 
L assumir que | 


(6.3)1 

a distribuiç 
ichy tem o 
normal. A dis- 
te são X, X, 

distribuição qu 
ítro estimador 

imos estimado 
é muito sensiv 
jvável a apariç 


extremidade da amostra) produz estimativas razoavelmente comportadas sobre uma variedade bastante grande 
de modelos possíveis. Por essa razão, a média aparada com pequena porcentagem de aparagem é considerada 

um estimador robusto. 

Em algumas situações, a escolha não está entre dois estimadores diferentes construídos a partir da mesma 
amostra, mas entre os estimadores baseados em dois experimentos diferentes. 

Exemplo 6.7 

Suponha que certo tipo de componente possua uma distribuição de vida útil exponencial com parâmetro À, de 
modo que a vida útil esperada seja /x = 1/À. Uma amostra de n componentes é selecionada e cada um é colo- 
cado em funcionamento. Se o experimento for continuado até que todas as n vidas úteis, X,, ..., X„, tenham sido 
observadas, então X será um estimador não-tendencioso de fx. 

Em alguns experimentos, entretanto, os componentes são deixados em funcionamento somente até o momento 
da r-ésima falha, onde r < n. Esse procedimento é denominado censo. Seja X, a vida útil da primeira falha (a vida 
útil mínima entre os n componentes), X 2 o tempo em que ocorre a segunda falha (a segunda menor vida útil) e as- 
sim por diante. Uma vez que o experimento termina na hora Y r , a vida útil total acumulada no término é 

T r = t Y i + (n - r)Y r 

i-i 

Agora, demonstramos que p. = TJr é um estimador não-tendencioso de fx . Para isso, precisamos de duas 
propriedades das variáveis exponenciais: 

1. A propriedade de ausência de memória (veja a Seção 4.4), a qual diz que, em qualquer instante, a vida 
útil remanescente possui a mesma distribuição exponencial que a vida útil original. 

2. Se X„ ... , X* são independentes, cada exponencial com parâmetro À, então, min(X,,..., X*) é exponencial 
com parâmetro kÀ e possui valor esperado l/(tfcA). 

Uma vez que todos os n componentes duram até X,, n — 1 dura uma quantidade de tempo adicional, 
K 2 ~ X„ n - 2 uma quantidade de tempo adicional X, — X 2 e assim por diante, outra expressão para T r é 

T r = nY, +(n- 1)(X 2 - X.) + (n - 2 )(X 3 -X 2 ) + --- 
+ (n — r + l)(X f — X r _,) 

Mas X, é o mínimo de n variáveis exponenciais, assim, £( X,) = 1/(«À). De forma semelhante, X> — X, é o 
menor das n — 1 vidas úteis remanescentes, cada exponencial com parâmetro À (pela propriedade de ausência 
de memória), assim, E(Y 2 — X,) = !/[(« — 1)À]. Continuando, E(Y i+ , — X,) = l/[(n — í)À], então. 


E(T r ) = n£(X,) + (n - 1)£(X, - X,) + 


= n • - 7 - + (n 

n\ 

r 


1 ) 


1 


(n - 1 )À 


+ {n-r+ 1 )£(X, -X r _.) 
• + (n-r + 1 ) 


(n - r + 1 )À 


Dessa forma, E(T r /r) = (l/r)£(T r ) = (l/r) • (r/À) = 1/À =(x, conforme afirmado. 
i influenciado p« Como exemplo, suponha que 20 componentes sejam testados e r = 10. Então, se os primeiros 10 tempos 
bssíveis para ess de falha forem tli \ 5i 2 9, 33, 35, 40, 47, 55, 58 e 72, a estimativa de fx é 


u= 11 + 15 + ••• + 72 + (10)(72) = 111 5 
10 


Qvelmente bem 0 1 
qualquer uma < 

A vantagem do experimento com censo é que termina mais rápido que o experimento sem censo, 
de uma distrib lírcían to, pode-se mostrar que V(T r /r) = l/(À 2 r) é maior que l/(À 2 n), a variância de X no experimento 

20 % (de ^ ncenso - 
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Relatando uma Estimativa Pontual: O Erro-Padrão 

Além de relatar o valor de uma estimativa pontual, deve-se indicar a sua precisão. A medida comum de precisão 
é o erro-padrão do estimador usado. 


DEFINIÇÃO 


O erro-padrão de um estimador 0 é seu desvio padrão cr ò = VV(0). Se aquele envolver 
parâmetros desconhecidos cujos valores possam ser estimados, a substituição dessas esti- 
mativas em (Tf, produz o erro-padrão estimado (desvio padrão estimado) do estimador que 
pode ser representado por (o * sobre cr enfatiza que O}, está sendo estimado) ou por % 


Exemplo 6.8 (continuação do Exemplo 6.2) 

Assumindo que a voltagem de quebra é normalmente distribuída, f± = X é o melhor estimador de p. Se o valor 
de cr for conhecido como 1,5, o erro-padrão de X é o* = cr/Vn = 1,5/V2Õ = 0,335. Se, como geralmente é o 
caso, o valor de cr for desconhecido, a estimativa à = s = 1 ,462 é substituída em cr* para se obter o erro-padrão 
estimado ô* = s* = s/^/n = 1,462/V2Õ = 0,327. I 

Exemplo 6.9 (continuação do Exemplo 6.1) 

O erro-padrão de p = X/n é 




Uma vez que ptq = 1 — p s ão desconhe cidos, substituímos p = xJnzq = 1 — x/n em <t p , produzindo o erro- 
padrão estimado cr p = Vpqln = V(06)(0,4)/25 = 0,098. De maneira altern ativa, uma vez que o maior valor de pq é 
obtido quando p = q = 0,5, um limite superior no erro-padrão é V 1/(4 ri) = 0,10. 

Quando o estimador pontual 0 possui uma distribuição aproximadamente normal, que geralmente será o 
caso quando n for grande, então podemos ficar razoavelmente seguros de que o valor real de 0 está dentro de 
aproximadamente 2 erros-padrão (desvios padrão) de 0. Dessa forma, se uma amostra de n = 36 vidas úteis 
de componentes fornecer jl = x = 28,50 e s = 3,60, então 5/Vn = 0,60, assim, dentro de 2 erros-padrão esti- 
mados de jx, transforma-se no intervalo 28,50 ± (2)(0,60) = (27,30, 29,70). 

Se 0 for aproximadamente normal (não necessariamente) mas não-tendencioso, então pode-se mostrar que 
a estimativa desviará de 0 por 4 erros-padrão no máximo 6% das vezes. Esperaríamos, então, que o valor real 
estivesse dentro de 4 erros-padrão de 0 (e essa é uma afirmação bastante conservadora, uma vez que se aplica a 

A A 

qualquer d não-tendencioso). Resumindo, o erro-padrão nos diz grosseiramente dentro de qual distância de Apo- 
demos esperar que o valor real de 0 esteja. 

A forma do estimador 0 pode ser suficientemente complicada, de modo que a teoria estatística-padrão não 
pode ser aplicada a fim de se obter uma expressão para (r d . Isso é verdade, por exemplo, no caso 0 = cr, 0 = , 
o desvio padrão da estatística 5, cr s , geralmente não pode ser determinado. Recentemente, um novo método com- 
putacional chamado bootstrap foi desenvolvido para tratar desse problema. Suponha que a fdp da população seja 
/(jc; 0), um membro de uma família paramétrica, e que os dados x u x 2 ,..., x n fornecem 0 = 21,7. Agora, usam' 
o computador para obter “amostras do bootstrap" da fdp/(x; 21.7) e, para cada amostra, calculamos uma “es:! 
mativa de bootstrap” 0*: 

Primeira amostra do bootstrap: jc* jc* • • • , x*\ estimativa = Ò* 

Segunda amostra do bootstrap: x* x*, . . . , x*: estimativa = 0* 


0-ésima amostra do bootstrap: x*, x*, . . . , x*‘, estimativa =0* 
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Geralmente é usado B = 100 ou 200. Agora, seja 6* = "ZÒ*/B a média amostrai das estimativas do boots- 
trap. A estimativa do bootstrap do erro-padrão de 0' s é agora apenas o desvio padrão amostrai dos 0*'s: 

i 

(Na literatura sobre bootstrap , B geralmente é usado no lugar de B — 1 ; para valores típicos de 5, há, em 
geral, pouca diferença entre as estimativas resultantes.) 

Exemplo 6.10 

Um modelo teórico sugere que X, o tempo de quebra de um fluido isolante entre os elétrodos em uma voltagem 
específica, possui f(x; A) = Ae~**, uma distribuição exponencial. Uma amostra aleatória de n = 10 tempos de 
quebra (min) fornece os seguintes dados: 

41,53 18,73 2,99 30,34 12,33 117,52 73,02 223,63 4,00 26,78 

Uma vez que E(X) = 1/À,£(X) = 1/À, então uma estimativa razoável de ÀéÀ = l/x = 1/55,087 = 0,018153. 
Usamos um pacote estatístico de computador para obter B - 100 amostras do bootstrap , cada uma de tamanho 
10, a partir de f(x; 0,0 1 8 1 53). A primeira de tais amostras foi 4 1 ,00, 1 09,70, 1 6,78, 6,3 1 , 6,76, 5,62, 60,96, 78,8 1 , 
192,25, 27,61, da qual Z*? = 545,8 eÀ* = 1/54,58 = 0,01832. A média das 100 estimativas do bootstrap é À* = 
0,02153, e o desvio padrão amostrai dessas 100 estimativas é s~ Á = 0,0091, a estimativa do bootstrap do erro- 
padrão dos À’s. Um histograma dos 100 À*’s estava positivamente inclinado, sugerindo que a distribuição 
amostrai de À também possuía essa propriedade. ■ 

Às vezes, o pesquisador deseja estimar a característica de uma população sem assumir que sua distribuição 
pertence a uma família paramétrica particular. Um caso desses ocorreu no Exemplo 6.6, em que uma média 
aparada 10% foi proposta para estimar o centro da distribuição simétrica da população d. Os dados do Exemplo 
6.2 forneceram 9 = jc tr(10) = 27,838, mas agora não há /(jc; 6) assumido. Então, como podemos obter uma 
amostra do bootstrapl A resposta é considerar a própria amostra como constituinte da população (as n = 10 ob- 
servações no Exemplo 6.2) e tirar B amostras diferentes, cada uma de tamanho n, com substituição da referida 
população. O livro de Bradley Efron e Robert Tibshirani ou o de John Rice, listados na bibliografia, fornecem 
mais informações. 


Exercícios | Seção 6.1 (1-19) 

1. 0s dados que seguem sobre a resistência à flexão (MPa) 
das vigas de um tipo de concreto foram introduzidos no 
Exemplo 1.2. 
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a. Calcule uma estimativa pontual do valor médio da 
resistência para a população conceituai de todas as 
vigas fabricadas dessa forma e diga qual estimador 
você utilizou. ( Sugestão : Zx, = 219,8.) 

b. Calcule uma estimativa pontual do valor da resis- 
tência que separa as 50% mais fracas de todas as vi- 
gas das 50% mais fortes e diga qual estimador você 
utilizou. 


c. Calcule e interprete uma estimativa pontual do 
desvio padrão da população o. Que estimador você 
utilizou? ( Sugestão : Zxj = 1860,94.) 

d. Calcule uma estimativa pontual da proporção de to- 
das as vigas cuja resistência à flexão exceda 10 MPa. 
(Sugestão: considere como observação um “suces- 
so” se exceder 10.) 

e. Calcule uma estimativa pontual do coeficiente de 
variação (rlp da população e diga qual estimador 
você utilizou. 

2. Uma amostra de 20 alunos que recentemente tiveram 
estatística básica descobriu as seguintes informações so- 
bre a marca das suas calculadoras (T = Texas Instru- 
ments, H = Hewlett Packard, C = Cassio, S = Sharp) 
TTHTCTTSCH 
SSTHCTTTHT 
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a. Calcule a proporção real de todos os alunos que pos- 
suem uma calculadora Texas Instruments. 

b. Dos 10 alunos que tinham uma calculadora TI, 4 
possuíam calculadoras com gráfico. Calcule a pro- 
porção de alunos que não possuem uma calculadora 
com gráfico TI. 

3. Considere a seguinte amostra de observações sobre a 
espessura da camada da pintura de baixa viscosidade 
(“Achieving a Target Value for a Manufacturing Process: 
A Case Study ” J. of Quality Technology , 1992, p. 22-26): 

0,83 0,88 0,88 1,04 1,09 1,12 1,29 1,31 

1,48 1,49 1,59 1,62 1,65 1,71 1,76 1,83 

Assuma que a distribuição da espessura da camada seja 
normal (um gráfico de probabilidade normal suporta 
fortemente essa hipótese). 

a. Calcule uma estimativa pontual do valor médio 
da espessura da camada e diga qual estimador você 
utilizou. 

b. Calcule uma estimativa pontual da mediana da dis- 
tribuição da espessura da camada e diga qual esti- 
mador você utilizou. 

c. Calcule uma estimativa pontual do valor que separa 
os 10% maiores de todos os valores na distribuição 
da espessura dos 90% remanescentes e diga qual es- 
timador você utilizou. ( Sugestão : mostre o que você 
está tentando estimar em termos de /x e o*.) 

d. Calcule P(X < 1,5), isto é, a proporção de todos os 
valores da espessura menores que 1,5. ( Sugestão : Se 
você conhecesse os valores de /x e o\ poderia calcu- 
lar essa probabilidade. Esses valores não estão dis- 
poníveis, mas podem ser estimados.) 

e. Qual é o erro-padrão estimado do estimador que 
você utilizou na parte (b)? 

4. O artigo do qual os dados do Exercício 1 foram tirados 
também forneceu as observações de resistência a seguir 
para os cilindros: 

6,1 5,8 7,8 7,1 7,2 9,2 6,6 8,3 7,0 8,3 

7,8 8,1 7,4 8,5 8,9 9,8 9,7 14,1 12,6 11,2 

Antes de obter os dados, represente as resistências da 
viga por X h ..., X m e as resistências do cilindro por T,, 
..., Y„. Suponha que os X,s constituem uma amostra 
aleatória de uma distribuição com média /x, e desvio 
padrão o*, e que os Y,s formem uma amostra aleatória 
(independente dos X t s) de outra distribuição com média 
/x 2 e desvio padrão os. 

a. Use as regras do valor esperado para mostrar que 
X - Y é um estimador não-tendencioso de /li, - /x?. 
Calcule a estimativa para os dados fornecidos. 

b. Use as regras de variância do Capítulo 5 para obter 
uma expressão para a variância e o desvio padrão 
(erro-padrão) do estimador da parte (a) e calcule o 
erro-padrão estimado. 

c. Calcule uma estimativa pontual da relação cr,/< 7 2 dos 
dois desvios padrão. 


d. Suponha que uma única viga e um único cilindro se- 
jam selecionados aleatoriamente. Calcule uma esti- 
mativa pontual da variância da diferença X - Y entre 
a resistência da viga e a resistência do cilindro. 

5. Como exemplo de uma situação em que várias estatís- 
ticas diferentes podiam razoavelmente ser usadas para 
calcular uma estimativa pontual, considere uma popu- 
lação de N faturas. Associado a cada fatura está seu 
“valor contábil”, o valor registrado dessa fatura. Seja 
por T o valor contábil total, um valor conhecido. Alguns 
desses valores são errôneos. Uma auditoria será rea- 
lizada, selecionando aleatoriamente n faturas e deter- 
minando o valor (correto) examinado de cada uma. 
Suponha que a amostra forneça os seguintes resultados 
(em dólares). 


Fatura 

1 2 3 4 5 

Valor contábil 300 720 526 200 127 

Valor examinado 300 520 526 200 157 

Erro 0 200 0 0 -30 

Sejam 

Y = valor contábil médio amostrai 
X = valor médio amostrai examinado 


D = erro médio amostrai 

Diversas estatísticas diferentes para estimar o valor 
(correto) examinado total foram propostas (veja “Sta- 
tistical Models and Analysis in Auditing”, Statistia 
Science, 1989, p. 2-33). Elas incluem 

Média por estatística da unidade = NX 
Estatística da diferença = T — ND 
Estatística da razão = T • (X/Y) 

Se N = 5000 e T = 1 .761 ,300, calcule as três estin 
vas pontuais correspondentes. (O artigo mencion 
discute as propriedades desses estimadores.) 

6. Considere as observações que seguem sobre o fluxo di- 
reto (1000 acre-pés) registrado em um posto em Co 
rado de 1° de abril a 3 1 de agosto, por um período de 31 
anos (Dados extraídos de um artigo do volume de 1974 
de Water Resources Research). 
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94,33 

Um gráfico de probabilidade apropriado confirma o 
da distribuição lognormal (veja Seção 4.5) como 
modelo razoável do fluxo dos rios. 
a. Calcule os parâmetros da distribuição. [Suges 
lembre-se que X possui distribuição lognormal c 
parâmetros /x e ít 2 se \n(X) for normalmente di* 
tribuído com média /x e variância a 2 .] 
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b. Use as estimativas da parte (a) para calcular uma es- 
timativa do valor esperado de fluxo dos rios. [Suges- 
tão: qual é o £(X)? ] 

7. a. Uma amostra aleatória de 10 casas em uma área 
específica, todas aquecidas com gás natural, é sele- 
cionada; a quantidade de gás (termos) usada durante 
o mês de janeiro é determinada para cada casa. As ob- 
servações resultantes são: 103, 156, 118, 89, 125, 
147, 122, 109, 138, 99. Seja /jl o consumo médio de 
gás durante janeiro por todas as casas dessa área. 
Calcule a estimativa pontual de /x. 

b. Suponha que existam 10.000 casas nessa área que 
utilizem gás natural para aquecimento. Seja r a 
quantidade total de gás usado por todas essas casas 
no mês de janeiro. Calcule r, usando os dados da 
parte (a). Que estimador você utilizou ao calcular 
sua estimativa? 

c. Use os dados na parte (a) para calcular p, a 
proporção de todas as casas que usaram no mínimo 

100 termos. 

d. Forneça uma estimativa pontual do uso mediano da 
população (o valor médio na população de todas as 
casas) com base na amostra da parte (a). Que esti- 
mador você utilizou? 

8. Em uma amostra aleatória de certo tipo de 80 compo- 
nentes, 12 são considerados defeituosos. 

a. Forneça uma estimativa pontual da proporção de to- 
dos os componentes que não são defeituosos. 

b. Um sistema será construído, selecionando-se aleato- 
riamente dois desses componentes e conectando-os 
em série, conforme ilustramos abaixo: 


A conexão em série implica que o sistema funcionará 
somente se nenhum componente estiver com defeito 
(istoé, se ambos funcionarem adequadamente). Calcule 
a proporção de todos os sistemas que funcionam ade- 
quadamente. [Sugestão: se p representa a probabili- 
dade de um componente funcionar corretamente, como 
pode P (funcionamentos do sistema) ser expresso em 
termos de p?] 

9. Todos os 150 itens fabricados recentemente são exami- 
nados e o número de arranhões por item é registrado (os 
itens são supostamente livres de arranhões), produ/indo 

os seguintes dados: 

Número de 
arranhões 

por item 0 1 2 3 4 5 6 7 

Freqiiência 

mervada 18 37 42 30 13 7 2 1 


Seja X = o número de arranhões em um item escolhido 
aleatoriamente, assuma que X possui uma distribuição 
de Poisson com parâmetro A. 

a. Determine um estimador não-tendencioso de A e cal- 
cule a estimativa dos dados. [Sugestão: £(X) =A 
para Poisson de X, então £(X) = ?] 

b. Qual é o desvio padrão (erro-padrão) do seu esti- 
mador? Calcule o erro-padrão estimado. ( Sugestão : 
ar} = A para Poisson de X.) 

10. Usando um bastão longo de comprimento /i, você 
traçará um gráfico quadrado em que o comprimento de 
cada lado é /x. Assim, a área do gráfico será /jl 2 . Entre- 
tanto, você não conhece o valor de /x, então decide fazer 
n medições independentes X„ X 2 , ..., X n do compri- 
mento. Assuma que cada X, tenha média /x (medições 
não- tendenciosas) e variância cr 2 . 

a. Mostre que X não é um estimador não-tendencioso 
para /jl 2 . [Sugestão: para qualquer va Y y E(Y 2 ) = 
V(Y) + [£(F)] 2 . Aplique a expressão com Y = X.] 

b. Para que valor de k o estimador X 2 - kS 2 é não-ten- 
dencioso para /x 2 ? [Sugestão: calcule E(X 2 - kS 2 ).] 

11 . De n, fumantes do sexo masculino escolhidos aleato- 
riamente, X, fumavam cigarro com filtro, enquanto de 
n 2 fumantes do sexo feminino selecionadas aleatoria- 
mente, X 2 fumavam cigarro com filtro. Represente por 
Pi e p 2 as probabilidades de um homem e uma mulher 
selecionados de modo aleatório, respectivamente, fu- 
marem cigarro com filtro. 

a. Mostre que (X,/n,) - (X 2 /n 1 ) é um estimador não- 
tendencioso para p, - p 2 . [Sugestão: £(X,) = n l p i 
para i = 1, 2.] 

b. Qual é o erro-padrão do estimador da parte (a)? 

c. Como você usaria os valores observados de jc, e x 2 
para calcular o erro-padrão do seu estimador? 

d. Se n { = n 2 = 200, jc, = 127 e jc 2 = 176, use o estima- 
dor da parte (a) para obter uma estimativa de p, - p 2 . 

e. Use o resultado da parte (c) e os dados da parte (d) 
para calcular o erro-padrão do estimador. 

12 . Suponha que certo tipo de fertilizante possua um rendi- 
mento esperado por acre de /x„ com variância cr 2 , 
enquanto o rendimento esperado de um segundo tipo de 
fertilizante seja /x 2 com a mesma variância a 2 . Re- 
presente por S? e S\ as variâncias amostrais dos rendi- 
mentos com base nos tamanhos de amostra n } e n 2y 
respectivamente, dos dois fertilizantes. Mostre que o 
estimador combinado 

(*, - 1)5? + fr», - ltfj 
n, + n 2 — 2 

é um estimador não-tendencioso de cr 2 . 

13 . Considere uma amostra aleatória X,, X„ da fdp 

/(jc; 0) = 0,5(1 + 0x) -1 < jc < 1 
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em que -1 < 0 < 1 (essa distribuição surge na física de 
partículas). Mostre que 6 = 3X é um estimador não-ten- 
dencioso de 0. [Sugestão: determine primeiro /x = 
E(X) = £(X).] 

14. Uma amostra de n aeronaves Pandemonium jet fighters 
capturadas resulta em números de série jc„ x 2 , Jt 3 , ..., x n . 
A CIA sabe que cada aeronave foi numerada consecu- 
tivamente na fábrica, começando com a e terminando 
com /3, de modo que o número total de aviões fabrica- 
dos é P - a + 1 (por exemplo: se a = 17 e /3 = 29, 
então, 29 - 17 + 1 = 13 aviões que têm números de 
série 17, 18, 19, ..., 28, 29, foram fabricados). Entre- 
tanto, a CIA não conhece os valores de a ou Um es- 
tatístico dessa instituição sugere o uso do estimador 
max(X,) - min(X ( ) + 1 para calcular o número total de 
aviões fabricados. 

a. Se n = 5, jc, = 237, x 2 = 375, jc 3 = 202, x 4 = 525 e 
jc, = 418, qual é a estimativa correspondente? 

b. Sob quais condições na amostra o valor da estimativa 
será exatamente igual ao número total real de aviões? 
A estimativa sempre será maior que o total real? Você 
acha que o estimador é não-tendencioso para calcular 
/3 - a + 1 ? Explique em uma ou duas frases. 

15. Seja X,, X 2 , X n uma amostra aleatória de uma dis- 
tribuição de Rayleigh com fdp 

f(x\ 0) = ^ e- xW9> X>0 

0 

a. Pode-se mostrar que E(X 2 ) = 20. Use esse fato para 
construir um estimador não-tendencioso de 0 com 
base em ]£X 2 (use regras de valor esperado para 
mostrar que é não-tendencioso). 

b. Calcule 0 a partir das n = 10 observações a seguir 
sobre a força vibratória de uma palheta de turbina 
sob condições especificadas: 

16,88 10,23 4,59 6,66 13,68 
14,23 19,87 9,40 6,51 10,95 

16. Suponha que o crescimento médio real /x de um tipo de 
planta durante o período de um ano seja idêntico ao de um 
segundo tipo, mas a variância de crescimento do primeiro 
tipo seja o- 2 , enquanto a do segundo é 4 a 2 . Sejam X,, ..., 
X m , m observações independentes de crescimento para o 

primeiro tipo [assim, E(X) = p, V(X,) = cr 2 ], e T, K„, 

n observações independentes de crescimento para o se- 
gundo tipo [E(Yj) = /x, V(Y t ) = 4c7 2 ]. 

a. Mostre que, para qualquer 8 entre 0 e 1 , o estimador 
/x = ÔX + (1 - 8)Y é não-tendencioso para p. 

b. Para m e n fixos, calcule V(p) e depois determine o 
valor de ôque minimiza V(p). [ Sugestão : diferencie 
V(p) em relação a &] 

17. No Capítulo 3, definimos uma va binomial negativa 
como o número de falhas que ocorrem antes do r-ésimo 
sucesso em uma seqüência de tentativas de sucesso / 
falha idênticas e independentes. A função de massa de 
probabilidade (fmp) de X é 


nb( jc; r, p ) = 




pY x = 0, 1, 2, . . À 
caso contrário 


a. Suponha que r > 2. Mostre que 

p = (r “ 1)/(X + r - 1) 

é um estimador não-tendencioso para p. 

tão : Desenvolva E(p) e cancele x + r — 1 dentro 

da soma.] 

b. Um repórter que deseja entrevistar cinco pessoas 
que apoiam um candidato começa perguntando a 
elas se apóiam (5) ou não ( F ) tal candidato. Se a se- 
qüência das respostas é SFFSFFFSSS, estime p = 
proporção real que apóia o candidato. 

18. Seja X,, X 2 , .... X„ uma amostra aleatória de uma fdp/(x) 
simétrica em relação a /x, de modo que X seja um esti- 
mador não-tendencioso de /x. Se n for grande, pode-se 
mostrar que V(X) l/(4n[/(/x)] 2 ). 

a. Compare V{X) a V(X) quando a distribuição subja- 
cente for normal. 

b. Quando a fdp subjacente for Cauchy (veja o Exemplo 
6.6), V(X) = oo, então X será um terrível estimada 
Qual é V(X), neste caso, quando n for grande? 

19. Uma pesquisadora deseja estimar a proporção de ali 
que violaram o código de honra em certa universi 
Ao obter uma amostra aleatória de n alunos, ela per< 
que perguntar a cada um: “Você violou o código de honraf J 
provavelmente resultará em algumas respostas falsas. 
Considere o seguinte esquema, chamado de técnica de 
resposta aleatória. A pesquisadora monta um baralhai 
de 100 cartas, das quais 50 são do tipo I e 50 do tipo IL 

Tipo I: Você violou o código de honra (sim ou não)? 

Tipo II: O último dígito de seu número de telefone é 
0, 1 ou 2 (sim ou não)? 

Cada aluno da amostra aleatória é solicitado a misi 
o baralho, tirar uma carta e responder à pergunta res 
tante com sinceridade. Devido à pergunta irrelev 
nas cartas do tipo II, a resposta sim não estigi 
mais o entrevistado, de modo que assumimos que 
respostas sejam verdadeiras. Seja p a proporção 4 
violadores do código de honra (isto é, a probabili 
de um aluno selecionado aleatoriamente ser um ví 
lador) e por A = P (resposta sim). Então, A e p são r 
cionados por IA = 0,5 p 4* (0,5)(0,3). 

a. Seja Y o número de respostas afirmativas, de 
que Y ~ Bin(n, A). Dessa forma. Y/n é um esti 
não-tendencioso de A. Deduza um estimador parajj 
com base em Y. Se n = 80 e y = 20, qual é sua 
mativa? ( Sugestão : resolva A = 0,5 p + 0,15 
e então substitua Y/n por A.) 

b. Use o fato de E(Yln) = A para mostrar que seu e 
mador p é não-tendencioso. 

c. Se havia 70 cartas tipo I e 30 tipo II, qual seria 
estimador para pl 
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6.2 I Métodos de Estimativa Pontual 

A definição de não-tendenciosidade geralmente não indica como os estimadores não-tendenciosos podem ser 
deduzidos. Agora, discutimos dois métodos “construtivos” para obter estimadores pontuais: o método dos mo- 
mentos e o método da máxima verossimilhança. Por “construtivo” queremos dizer que a definição geral de cada 
tipo de estimador sugere explicitamente como obter o estimador em qualquer problema específico. Embora os 
estimadores da máxima verossimilhança sejam geralmente preferíveis aos estimadores de momentos devido a 
certas propriedades de eficiência, eles usualmente precisam significativamente de mais cálculos que os esti- 
madores de momentos. Às vezes, é o caso de esses métodos produzirem estimadores não-tendenciosos. 

0 Método dos Momentos 

A idéia básica deste método é igualar certas características da amostra, como a média, aos valores esperados cor- 
respondentes da população. Então, resolvendo essas equações para os valores dos parâmetros desconhecidos 
produz os estimadores. 


DEFINIÇÃO 

Seja X„..., X„ uma amostra aleatória de uma fmp ou fdp f(x). Para k = 1 , 2, 3, ..., o 

fc-ésimo momento da população ou Jt-ésimo momento da distribuição f(x) é E(X k ). 
0 A-ésimo momento amostrai é (l/n)Z7=iX*. 


Dessa forma, o primeiro momento da população é E(X) =/ieo primeiro momento amostrai é 2X,/n = X. 
Os segundos momentos da população e da amostra são £(X 2 ) e ZXç/n, respectivamente. Os momentos da po- 
pulação serão funções de quaisquer parâmetros desconhecidos 0,, 0 2 , ... 


DEFINIÇÃO 

Seja X|, X 2 , ..., X„ uma amostra aleatória de uma distribuição com fmp ou fdp f(x; 0,, 
..., 0 m ), onde 0|, .... 0 m são parâmetros cujos valores são desconhecidos. Então, os esti- 
madores pelo método dos momentos 0,, .... 0„, são obtidos igualando-se os primeiros m 
momentos da amostra aos primeiros m momentos da população correspondente e resol- 
vendo para 0,, ..., d„. 


Se, por exemplo, m = 2, E(X) e £(X 2 ) serão funções de 0, e 0 2 . Definindo E(X) = (l/n) ZX, (= X) e 


E(X : ) = (1 In) £X; fornece duas equações em 0, e 0 2 . A solução, então, define os estimadores. Para estimar a 
média da população fi, o método fornece fx = X, assim, o estimador é a média amostrai. 

Exemplo 6.11 

Seja X„ X 2 , ..., X„ uma amostra aleatória de tempos de serviço de n clientes em uma determinada instala- 
ção, onde a distribuição subjacente é considerada exponencial com parâmetro A. Uma vez que há somente 
um parâmetro a ser estimado, o estimador é obtido igualando £(X) a X. Desde que £(X) = 1/A para uma 
distribuição exponencial, temos 1/A = X ou A = 1/X. O estimador pelo método dos momentos de A é, 

então, A = 1/X. ■ 


Exemplo 6.12 

Seja X„ ..., X„, uma amostra aleatória de uma distribuição gama com parâmetros a e )3. Pela Seção 4.4, 
E(X) =a/3 e £(X 2 ) = /3T(a + 2)/r(a) = /3 2 (a + l)a. Os estimadores pelo método dos momentos de a e /3 são 

obtidos, resolvendo-se 

X = a/3 -ZX 2 = a(a + l)/3 2 
n 
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Uma vez que a(a 4- l)/3 : = cr/3 2 + a/3 2 e a primeira equação implica cr/3 : = X'. a segunda equação 
se toma 

-2x: = x 2 + a^ 

n 

Dividindo-se cada membro dessa segunda equação pelo lado correspondente da primeira e substituindo-se 
de volta, são fornecidos os estimadores 

X 2 „ (1 InjZxí-X 2 

â_ (l/n)ZX?- T P- X 

Para ilustrar, os dados do tempo de sobrevida mencionados no Exemplo 4.21 são 

152 115 109 94 88 137 152 77 160 165 

125 40 128 123 136 101 62 153 83 69 

com x = 1 13,5 e (1/20)Z-T7 = 14,087.8. As estimativas são 

â = (113,5)3 = 10 7 fí= 14-087,8 -(113,5)1 = 10 , 6 

14.087,8 - (113,5) 2 113,5 

Essas estimativas de ae j3 diferem dos valores sugeridos por Gross e Clark porque eles usaram uma téc- 
nica de estimativa diferente. 

Exemplo 6.13 

Seja X,, ..., X„ uma amostra aleatória de uma distribuição binomial negativa geral com parâmetros r e p (Seção 
3.5). Uma vez que E(X) = r(l — p)lp e V(X) = r(l — pVp 2 , E(X 2 ) = V(X) + [£(X)] 2 = r(l - p) 
(r — rp + 1 )/p 2 . Igualando E(X) a X e E(X 2 ) a (l/njZX; finalmente fornece 

X A F 

P= (i/«)Zxr-x 2 ^ = (1 //.iSF-F-x 

Como ilustração, Reep, Pollard e Benjamin (“Skill and Chance in Bali Games,” J. Royal Stat. Soc 1971, 
p. 623-629) consideram a distribuição binomial negativa como um modelo para o número de gols por jogo mar- 
cados pelos times da Liga Nacional de Hóquei. Os dados de 1966-1967 aparecem a seguir (420 jogos): 

Gols 0 1 23456789 10 

Frequência 29 71 82 89 65 45 24 7 4 1 3 


Então, 


e 


x = Xjc f /420 = [(0)(29) + (1)(71) + • • • 4- (10)(3)]/420 = 2,98 
Z.xj/420 = [(0) 2 (29) + ( 1 ) 2 (7 1 ) + • • • + (10) 2 (3)]/420 = 12,40 



Dessa forma, 
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Embora r por definição deva ser positivo, o denominador de r pode ser negativo, indicando que a distri- 
buição binomial negativa não é apropriada (ou que o estimador pelo método dos momentos é inadequado). ■ 



imadores de Máxima Verossimilhança 


0 método da máxima verossimilhança foi introduzido primeiro por R. A. Fisher, um geneticista e estatístico, na 
década de 1920. A maioria dos estatísticos recomenda esse método, pelo menos quando o tamanho da amostra 
for grande, uma vez que os estimadores resultantes têm certas propriedades de eficiência desejáveis (veja a se- 
gunda proposição da página 240). 


Exemplo 6.14 


Uma amostra de 10 capacetes de ciclista fabricados por certa empresa é obtida. Em teste, descobre-se que o 
primeiro, o terceiro e o décimo capacetes estão com defeito, enquanto os demais não. Seja p = P(capacete com 
defeito) e defina X X, 0 por X, = 1 se o í-ésimo capacete estiver com defeito e por zero, caso contrário. En- 

tão, os XjS observados são 1,0, 1 . 0, 0, 0, 0, 0, 0, 1 , de modo que a fmp conjunta da amostra é 


/(*„ x 2 , ... , x ]0 ‘, P) = p( 1 ~ p)p p = p\ 1 - p) 1 


(6.4) 


Perguntamos agora: “Para que valor de p a amostra observada é mais provável de ter ocorrido?” Isto é, quer- 
emos determinar o valor de p que maximiza a fmp (6.4) ou, de forma equivalente, que maximiza o log natural 
de (6.4).- Uma vez que 

ln[/(x p)] = 3 ln(/>) + 7 ln(l - p) (6.5) 


a qual é uma função diferenciável de p, igualando a derivada de (6.5) a zero, resultando o valor máximo’ 


-f- ln[/(*,„.„ 4T, 0 ; /?)] 

dp 


3 

P 




£ 

n 


onde v é o número observado de sucessos (capacetes com defeito). A estimativa de p é agora P = Chama-se 
estimativa da máxima verossimilhança, pois, para valores fixos de .... jc io , esse é o valor do parâmetro que ma- 
ximiza a verossimilhança (fmp conjunta) da amostra observada. 

Observe que, se nos dissessem somente que entre os 10 capacetes havia três que estavam com defeito, a 
Equação (6.4) seria substituída pela fmp binomial - p)\ que também é maximizada parap = ■ 


DEFINIÇÃO 


Sejam X,, X 2 X„ a fmp ou fdp conjunta 

/(*„ x 2 , .... 0„ .... 0J (6.6) 

onde os parâmetros 0,, .... 0„, têm valores desconhecidos. Quando Jt lt x n são os valo- 
res observados da amostra e (6.6) é considerada uma função de 0,, .... 0„, é denomina-se 

função de verossimilhança. As estimativas de máxima verossimilhança (emvs) 0 0 m 

são os valores dos 0,s que maximizam a função de verossimilhança, de modo que 

f(x 0 0 m ) >/(* 0|, .... 0J para todos os 0„ .... 0 m 

Quando os X,s são substituídos no lugar de jc,s, resultam os estimadores de 
máxima verossimilhança. 




! Uma vez que In(gU)] é uma função monotônica de ç( v), determinar x que maximiza ln[#(.r>] é equivalente a maximizar a própria g(x). Em estatística, 
ciücuiaco logaritmo geralmcnte muda um produto para uma soma. com a qual é mais fácil trabalhar. 

Evu conclusão requer a verificação da segunda derivada, mas os detalhes são omitidos. 
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A função verossimilhança nos diz quão provável a amostra observada é uma função dos valores dos 


parâmetros possíveis. Maximizar a verossimilhança fornece os valores dos parâmetros para os quais a amostra 
observada é mais provável de ter sido gerada - isto é, os valores de parâmetro que “mais aproximadamente con- 
cordam” com os dados observados. 

Exemplo 6.15 

Suponha que X„ X 2 , .... X n seja a amostra aleatória de uma distribuição exponencial com parâmetro À. Devido à 
independência, a função verossimilhança é o produto das fdps individuais: 


Igualar (í//dÀ)[ln( verossimilhança)] a zero resulta m/à — X*, = 0, ou A = n/X*/ = l/x. Dessa forma, a emv 
é À = 1/X; é idêntica ao método de estimadores pelos momentos [mas não é um estimador não-tendencioso, uma 


Para determinar os valores máximos de fie cr 2 , devemos calcular as derivadas parciais de ln(/) em relação 
a fie cr 2 , igualá-las a zero e resolver as duas equações resultantes. Omitindo os detalhes, as emvs resultantes são 


A emv de cr 2 não é o estimador não-tendencioso; então, dois princípios diferentes de estimativa (não- 


Exemplo 6.17 

No Capítulo 3, discutimos o uso da distribuição de Poisson para modelar o número de “eventos” que oco 
em uma região bidimensional. Assuma que, quando a região R, que está servindo como amostra, possui área 
a(R), o número X de eventos que ocorrem em R tem distribuição de Poisson com parâmetro Á.a(R) (em que Aé 
o número esperado de eventos por unidade de área) que as regiões não-sobrepostas produzem Xs independentes.] 
Suponha que um ecologista selecione n regiões não-sobrepostas e conte o número de certa es 

cie de plantas encontrada em cada região. A fmp conjunta (verossimilhança) é então 


/(x„ ..., x„; À) = (Àe **i) (\e **«) = \ n e A5> < 


Oln(verossimilhança) é 


ln[/(x x„; À)] = n ln(À) - àZ*, 


vez que £( 1/X) =£ 1/£(X)]. 


Exemplo 6.16 

Seja X X„ a amostra aleatória de uma distribuição normal. A função verossimilhança é 



p-(x n - tíÇ-H2a í 'i 

V2 w 2 



então 


ln[/(x„ ..., x„; fi, cr 2 )] = - j ln(2w 2 ) - -^jX(*, - fi) 2 


tendenciosidade e máxima verossimilhança) produzem dois estimadores diferentes. 


I 



fA • a(£J1V- A " ( V 
x f 


= ra(/?,)P> ra(fi.)l J " • A Zt - • g -*^ 1 

X] ! • * ■ * * x n \ 
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0 ln(verossimilhança) é 

ln[p(*, x n \ A)] = 'Zx; • ln[íi(/?,)] + ln(A) • Zx, - \Za(R.) - £ln(;t,!) 


Calcular d!d\ ln(p) ln(p) e igualá-la a zero produz 


^f- ~ Za(R,) = 0 


então 


A = 


Ia(R.) 


A emv é então A = ZX,/Za(R,)- Isto é intuitivamente razoável, pois A é a densidade real (plantas por área 
de unidade), enquanto A é a densidade da amostra, uma vez que Za(Ri) é apenas a área total que serviu como 
amostra. Em virtude de E(X,) = A • a(/?,), o estimador é não-tendencioso. 

Às vezes, é usado um procedimento alternativo de amostragem. Em vez de fixar regiões a servirem como 
amostra, o ecologista selecionará n pontos em toda a área de interesse e representará por y, = a distância do 
i-ésimo ponto para a planta mais próxima. A função distribuição acumulada (FDA) de Y = distância para a planta 
mais próxima é 


F r (y) = P(Y < y) = 1 - P(Y > y) = 1 - p( nenhuma P lanta em um ) 

\ círculo de raio y J 

= ! _ _ -t 

0! 

Calculando a derivada de Fy(y) em relação a y produz 

f ( v . \\ = (27rAye~ Ávy2 y>0 
JrKy* > | o caso contrário 

Se agora montarmos a verossimilhança f r (y,; A) f Y (y„; A), diferenciando ln( verossimilhança), e as- 

sim por diante, a emv resultante é 

^ _ n _ número de plantas observadas 
ttZY} área total amostrada 

que também é a densidade amostrai. Pode-se demonstrar que, em um ambiente esparso (A pequeno), o método 
da distância é, de certo modo, melhor, enquanto em um ambiente denso, o primeiro método de amostragem 

é melhor. ■ 


Exemplo 6.18 

Seja A„ ..., X„ a amostra aleatória de uma fdp de Weibull 


f(x; a, /3) = 



X a ^ 


o 


x > 0 

caso contrário 


Escrever a verossimilhança e ln( verossimilhança), depois, definir (dl da)[\n{f)] = 0 e (â/5/3)[ln(/)] = 0 pro- 
duz as equações 



a = 


I>7- ln(x,) XlnÇxjH 


Z x T\ Ua 
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Essas duas equações não podem ser resolvidas explicitamente para fornecer fórmulas gerais para as funções 

â e Ao contrário, para cada amostra jc as equações devem ser resolvidas por um procedimento numérico 

iterativo. Mesmo os estimadores pelo método dos momentos para a e /3 são um tanto complicados (veja o 
Exercício 21). ■ 

Estimando as Funções de Parâmetros 

No Exemplo 6.16, obtivemos a emv de cr 2 quando a distribuição subjacente era normal. A emv de cr = Võ 2 , 
bem como tantas outras emvs, pode ser facilmente deduzida, usando-se a seguinte proposição. 


PROPOSIÇÃO 


Princípio de Invariância 

Sejam 0,, 0 2) ..., 0„, as emvs dos parâmetros 0,, 0 2 0,„. Então, a emv de qualquer função 

/i(0i, 0 2 , ..., 0,„) desses parâmetros é a função /i(0,,0 2 , ...,0 m ) das emvs. 


Exemplo 6.19 (continuação do Exemplo 6.16) 

No caso normal, as emvs de /a e cr 2 são jx = X e <r 2 = 2(X, — X) 2 /n. Para obter a emv da função h(ji, o -2 ) 
Ver 2 = cr, substitua as emvs na função: 


Ô- = Vo^= ^2(X, -X) 2 


A emv de cr não é o desvio padrão amostrai 5, embora sejam próximos, a menos que n seja relativ" 
te pequeno. 

Exemplo 6.20 (continuação do Exemplo 6.18) 

O valor médio de uma va X que tenha distribuição de Weibull é 

fi = /3 • T(1 + l/a) 

A emv de fi é, portanto, jx= /3r(l + l/a), onde a e /3 são emvs de a e /?. Em particular, X não é 
emv de /x, embora seja um estimador não-tendencioso. Pelo menos para n grande, jx é um estimador mé 
que X. 

Comportamento de Amostra Grande da EMV 

Embora o princípio da estimativa da máxima verossimilhança tenha apelação intuitiva considerável, a seguí 
proposição fornece base adicional para o uso das emvs. 


PROPOSIÇÃO 


Sob condições muito genéricas, a distribuição conjunta da amostra, quando o tamanho 
amostrai n é grande, o estimador da máxima verossimilhança de qualquer parâmetro 6 é 
aproximadamente não-tendencioso [E(0) ^ 6] e tem variância tão pequena quanto a que 
pode ser atingida por qualquer estimador. Dito de outra maneira, a emv 0 é aproximada- 
mente o ENTMV de 0. 


Em virtude desse resultado e do fato de as técnicas com base no cálculo geralmente poderem ser u 
dos para deduzir as emvs (embora com frequência sejam necessários métodos numéricos, como o método é 
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Newton), a estimativa de máxima verossimilhança é a técnica de estimativa mais amplamente usada entre os 
estatísticos. Muitos dos estimadores usados no restante do livro são emvs. Obter uma emv, entretanto, requer que 
a distribuição subjacente seja especificada. 


Algumas Complicações 

Às vezes, o cálculo não pode ser usado para obter as emvs. 


Exemplo 6.21 

Suponha que meu tempo de espera por um ônibus seja uniformemente distribuído em [0, 0] e que os resultados 

v v de uma amostra aleatória dessa distribuição tenham sido observados. Uma vez que f(x\ 0) = 1/0 para 

O<v<0eO, caso contrário. 


f(x d) = 


Vl_ 

d" 

L 0 


o < jt, < 0, . . . , o < x„ < d 

caso contrário 


Contanto que maxU,) < 0, a verossimilhança é 1/0", que é positiva, mas logo que 0 < max(x,), a verossi- 
milhança cai para 0. Este fato é ilustrado na Figura 6.4. O cálculo não funcionará porque o máximo da verossimi- 
lhança ocorre em um ponto de descontinuidade, mas a figura mostra que 0 = max(X,). Assim, se meus tempos 
de espera são 2,3; 3,7; 1,5; 0,4 e 3,2, então a emv é 0 = 3,7. 


Verossimilhança 



Figura 6.4 


A função verossimilhança do Exemplo 6.21 


Exemplo 6.22 

Um método geralmente usado para calcular o tamanho de uma população de animais selvagens envolve a rea- 
lização de um experimento de captura/recaptura no qual uma amostra inicial de M animais é capturada, todos 
são identificados e devolvidos à população. Após permitir tempo suficiente para os animais marcados se mistu- 
rarem na população, outra amostra de tamanho n é capturada. Com X = número de animais marcados na se- 
gunda amostra, o objetivo é usar o x observado para estimar o tamanho da população N. 

0 parâmetro de interesse é 0 = N, que pode assumir somente valores inteiros; assim, mesmo após deter- 
minar a função verossimilhança (fmp de X aqui), usar o cálculo para obter N apresentaria dificuldades. Se con- 
siderarmos um sucesso um animal anteriormente marcado que está sendo recapturado, então a amostragem é 
sem reposição de uma população que contém M sucessos e N — M falhas, de modo que X é uma va hipergeo- 
métrica e a função verossimilhança é 


p(x; N) = h{x\ n,M,N) = 



Com a natureza de N estimada em valor inteiro, entretanto, seria difícil calcular a derivada de p(x\ N). No 
entanto, se considerarmos a relação entre p(x; N) a p(x; N - 1), teremos 


p(.t; AO = {N — M) • {N — n) 
p{x\N- 1) N(N — M — n + x) 
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Essa relação é maior que 1 se e somente se N < Mn/x. O valor de N para o qual p{x\ N) é maximizado é, i 
portanto, o maior inteiro inferior a Mn/x. Se usarmos notação matemática-padrão [r] para o maior inteiro menor I 
ou igual a r, a emv de N é N = [Mn/x]. Como ilustração, se M = 200 peixes que são tirados de um lago e mar- 
cados, subsequentemente, n = 100 peixes que são recapturados, e entre os 100 há x = 11 peixes marcados, en- 
tão N = [(200)( 1 00)/ 11] = [1818,18] = 1818. A estimativa é realmente bastante intuitiva; x/n é a proporção da 
amostra recapturada que é marcada, enquanto M/N é a proporção da população inteira marcada. A estimativa é 
obtida igualando-se essas duas proporções (estimando a proporção de uma população pela proporção de 
uma amostra). ■ 

Suponha que X„ X 2 , ..., X n seja uma amostra aleatória de uma fdp /( jc; 0) simétrica em relação a 0, mas que 
o investigador esteja incerto quanto à forma da função /. Então, é desejável usar um estimador 0 que seja robusto I 
- isto é, que tenha bom desempenho para uma variedade ampla de fdps subjacentes. Tal estimador é uma média j 
aparada. Nos últimos anos, os estatísticos propuseram outro tipo de estimador, chamado Estimador M> com base 
em uma generalização da estimativa de máxima verossimilhança. Em vez de maximizar o logaritmo da 
verossimilhança Zln [/(*; 0)] para um/especificado, maximiza-se Zp(*,; 0)- A “função objetivo” p é selecionada 
para produzir um estimador com boas propriedades de robustez. O livro de David Hoaglin et al. (veja a biblio- j 
grafia) contém uma boa exposição sobre esse assunto. 


c. Se n - 20 e x - 3, qual é a emv da probabilidade 23. Dois sistemas diferentes de computador são monitora- 


Exercícios I Seção 6.2 (20-30) 


20. Uma amostra aleatória de n capacetes de ciclista fa- 
bricados por uma empresa é selecionada. Seja X = 
número entre os n que esteja com defeito, e p = P{eom 
defeito). Assuma que somente X seja observado, em vez 
da seqüência de Ss e Fs. 


onde -1 < 0. Uma amostra aleatória de 10 alunos pro- 
duz dados jc, = 0,92, x 2 = 0,79, jc 3 = 0,90, x 4 = 0,65, 
jc 5 = 0,86, jc 6 = 0,47, x-, = 0,73, Jt g = 0,97, jc 9 = 0,94, 
x w = 0,77. 


a. Use o método dos momentos para obter um esti- 


a. Encontre o estimador de máxima verossimilhança 


de p. Se n = 20 e x = 3, qual é a estimativa? 


mador de 0 e calcule a estimativa para esses dados, 
b. Obtenha o estimador de máxima verossimilhança de 


b. O estimador da parte (a) é não-tendencioso? 


0 e calcule a estimativa dos dados fornecidos. 


(1 - pY de nenhum dos cinco capacetes seguintes 
examinados estar com defeito? 


dos durante um total de n semanas. Seja X, o número de 
falhas do primeiro sistema durante a i-é sima semana d 
suponha que os X/s sejam independentes e tirados de 
uma distribuição de Poisson com parâmetro À,. De 
forma semelhante, seja Y ( o número de falhas do se- 
gundo sistema durante a i-é sima semana, e assuma 
independência em que cada Poisson de Y t possu&l 
parâmetro À 2 . Derive as emvs de À,, À 2 , e À, - À 2 . [Su- 
gestão: usando a independência, escreva a fmp conjunta 
(verossimilhança) dos X/s e Y/s juntos.] 


21. Seja X uma distribuição de Weibull com parâmetros a e 
/3, então 


E(X) = 0 • T(1 + l/a) 

V(X) = ^{Td + 2/a) - [T(l + l/a)] 2 ] 


a. Com base em uma amostra aleatória X,, ... , X„, es- 


creva equações para o método dos estimadores pelos 
momentos de e a. Mostre que, uma vez obtida a 
estimativa de a, a estimativa de p é determinada 
numa tabela da função gama, e que a estimativa de a 
é a solução para uma equação complicada que en- 
volve a função gama. 


24. Consulte o Exercício 20. Em vez de selecionar n- 20 
capacetes para examinar, suponha que eu examine os ca- 
pacetes em sucessão até que encontre r = 3 defeituosos, i 
Se o 20 a capacete for o terceiro com defeito (de modo 
que o número de capacetes examinados que não tii 


b. Se n = 20, x = 28,0, e Z*? = 16.500, calcule as es- 


timativas. [Sugestão: [T(l,2)] 2 /r(l,4) = 0,95.] 


defeito fosse x = 17), qual é a emv de p? Isso é o mesí 


22. Seja X a proporção de tempo distribuído que um aluno 
selecionado aleatoriamente gasta trabalhando em um 
teste de aptidão. Suponha que a fdp de X seja 


que a estimativa do Exercício 20? Por que ou por que 
não? É o mesmo que a estimativa calculada pelo esti- 
mador não-tendencioso do Exercício 17? 



'(0+ 1)jc* 0<jc< 1 
0 caso contrário 


25. A resistência de corte das 10 soldas de ponto de testeé 
determinada, produzindo os seguintes dados (psi): j 


392 376 401 367 389 362 409 415 358 375 1 
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a. Assumindo que a resistência de corte seja normal- 
mente distribuída, estime a resistência de corte mé- 
dia real e o desvio padrão da resistência de corte, 
usando o método da máxima verossimilhança. 

b. Novamente assumindo uma distribuição normal, es- 
time o valor da resistência abaixo do qual 95% das 
soldas terão a resistência especificada. ( Sugestão : 
qual é o 95 ü percentil em termos de p e cr? Agora, 
use o princípio da invariância.) 

26. Consulte o Exercício 25. Suponha que decidamos exa- 
minar outra solda de ponto de teste. Seja X = a re- 
sistência de corte da solda. Use os dados fornecidos 
para obter a emv de P(X < 400). [ Sugestão : P(X < 
400) = $((400 - p)la).] 

27. Seja X X n a amostra aleatória de uma distribuição 

gama com parâmetros aej 8. 

a. Encontre as equações cuja solução produz os esti- 
madores de máxima verossimilhança de a e f3. Você 
achaque eles podem ser resolvidos explicitamente? 

b. Mostre que a emv de p =a/3 é p = X. 

28. Seja X h X 2 , ..., X n a amostra aleatória da distribuição de 
Rayleigh com função de densidade dada no Exercício 

15. Determine 

a. o estimador de máxima verossimilhança de 0 e de- 
pois calcule a estimativa dos dados da força vi- 
bratória fornecida nesse exercício. Esse estimador é 
o mesmo que o estimador não-tendencioso sugerido 
no Exercício 15? 

b. a emv da mediana da distribuição da força vibra- 
tória. ( Sugestão : expresse primeiro a mediana em 

termos de 0.) 


29. Considere uma amostra aleatória X,, X 2 , ..., X n da fdp 
exponencial deslocada 

[\e~ Á(x ~ 0) x >0 

f(x ; A, 0) = \ n , . 

J l 0 caso contrário 

Considerando 0 = 0 fornece a fdp da distribuição ex- 
ponencial considerada anteriormente (com densidade 
positiva à direita de zero). Um exemplo da distribuição 
exponencial deslocada apareceu no Exemplo 4.4, em 
que a variável de interesse era o tempo de avanço no 
fluxo do tráfego, e 0 = 0,5 era o tempo de avanço mí- 
nimo possível. 

a. Obtenha os estimadores de máxima verossimilhança 
de 0 e À. 

b. Se são feitas n = 10 observações do tempo de avan- 
ço, resultando nos valores 3,11, 0,64, 2,55, 2,20, 
5,44, 3,42, 10,39, 8,93, 17,82 e 1,30, calcule as esti- 
mativas de 0 e À. 

30. No tempo t = 0; 20 componentes idênticos são exami- 
nados. A distribuição da vida útil de cada um é expo- 
nencial com parâmetro A. O investigador deixa a insta- 
lação de teste sem monitoramento. Retomando 24 
horas depois, o pesquisador termina imediatamente o 
teste, após perceber que y = 15 dos 20 componentes 
ainda estão funcionando (então, 5 falharam). Encontre 
a emv de k. ( Sugestão : seja Y = número que sobrevive 
24 horas. Então, Y ~ Bin(n, p). Qual é a emv de pl 
Agora, observe que p = P(X t > 24), em que X, é expo- 
nencialmente distribuído. O que relaciona A a p, de 
modo que o primeiro pode ser estimado, uma vez que o 
último o foi.] 


Exercícios Suplementares (31-38) 


31. Um estimador 0 é dito ser consistente se para qualquer 
€ > 0, P( \Ò - 0 1 > e) 0 quando n <-> ». Isto é, 0 é 
consistente se, à medida que o tamanho da amostra au- 
menta, menor é a probabilidade de 0 ser maior que e a 
partir do valor real de 0. Mostre que X é um estimador 
consistente de p quando a 2 < cc usando a desigualdade 
de Chebyshev do Exercício 43, do Capítulo 3. ( Su- 
gestão : a desigualdade pode ser reescrita na forma 

P ( | Y - > e) s (Tf/e 

Agora, identifique Y com X.) 

32. a. Seja X,, ..., X n a amostra aleatória de uma dis- 

tribuição uniforme em [0, 0] Então, a emv de 0 é 0 = 
Y = max(X ( ). Use o fato de Y < y se e somente se 
cadaX, < y para encontrar a fdc de Y. Então, mostre 
que a fdp de Y = max(X,) é 


fÁy) = 


SÇ- 0S,S( 

0 " 7 

0 caso contrário 


b. Use o resultado da parte (a) para mostrar que a 
emv é tendenciosa, mas que ( n + l)max(X,)/rt é 
não-tendenciosa. 


33. No tempo t - 0, há um indivíduo com vida em certa 
população. Um processo de nascimento puro, então, 
desenvolve-se como segue. O tempo até o primeiro 
nascimento é exponencialmente distribuído com parâ- 
metro A. Após o primeiro nascimento, há dois indiví- 
duos com vida. O tempo até que o primeiro dê à luz 
novamente é exponencial com parâmetro A e acontece 
de maneira semelhante com o segundo indivíduo. Dessa 
forma, o tempo até o próximo nascimento é o mínimo 
de duas variáveis exponenciais (A), que é exponencial 
com parâmetro 2 A. De forma semelhante, uma vez que 
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tenha ocorrido o segundo nascimento, há três indiví- 
duos com vida, de modo que o tempo até o nascimento 
seguinte é uma va exponencial com parâmetro 3A e as- 
sim por diante (a propriedade de ausência de memória 
da distribuição exponencial está sendo usada aqui). 
Suponha que o processo seja observado até que o sexto 
nascimento tenha ocorrido e que os tempos de nasci- 
mento sucessivos sejam 25,2, 41,7, 51,2, 55,5, 59,5, 
61,8 (a partir dos quais você deve calcular os tempos 
entre os nascimentos sucessivos). Encontre a emv de A. 
( Sugestão : a verossimilhança é um produto de ter- 
mos exponenciais.) 

34. A média dos erros quadráticos de um estimador 6 é 
MSE(0) = E(0 - O) 2 . Se 6 é não-tendencioso, então 
MSE(0) = V(0), mas em geral MSE(0) = V(Ô) + (desvio) 2 . 
Considere o estimador a 2 = KS 2 , em que S 2 = variância 
da amostra. Que valor de K minimiza a média dos erros 
quadráticos desse estimador quando a distribuição da po- 
pulação é normal? [Sugestão: pode-se mostrar que 

E[(S 2 ) 2 ] = (fl+ 1 )<r 4 /(n - 1) 

Em geral, é difícil achar que Ô minimiza MSE(0), mo- 
tivo pelo qual olhamos somente para estimadores não- 
tendenciosos e minimizamos V(0).] 

35. Seja X„ ..., X n a amostra aleatória de uma fdp que seja 
simétrica com relação a p. Um estimador de p consi- 
derado por realizar bem uma variedade de distribuições 
subjacentes é o estimador de Hodges-Lelunann. Para 
defini-lo, calcule primeiro para cada / < j e cada j = 1, 
2, ..., n a média de pareados X, y = (X, + X,)/2. Então, o 
estimador é p = a mediana dos X, y s. Calcule o valor 
dessa estimativa, usando os dados do Exercício 44. do 
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Capítulo 1. ( Sugestão : construa uma tabela quadrada 
com os XjS listados na margem esquerda e na parte su- 
perior. Depois, calcule as médias na diagonal e acima 
dela.) 

36. Quando a distribuição da população é normal, a media- 
na estatística { | X, — X | | X„ — X | }/0,6745 é usada 

para estimar cr. O estimador é mais resistente aos 
efeitos de outliers (observações distantes da parte prin- 
cipal dos dados) que o desvio padrão da amostra. Cal- 
cule a estimativa pontual correspondente e s para os 
dados do Exemplo 6.2. 

37. Quando o desvio padrão da amostra S se baseia em uma 
amostra aleatória de uma distribuição normal da popu- 
lação, pode ser demonstrado que 

E(S) = V2 /(« - l)r<n/2)<r/r((n - l)/2) 


Use essa equação para obter um estimador não-tenden- 
cioso para cr da forma cS. Qual é c quando n = 20? 

38. Todos os n espécimes serão pesados duas vezes na 
mesma escala. Represente por X, e Y, os dois pesos ob- 
servados do /-ésimo espécime. Suponha que X, e P 
sejam independentes entre si, cada um normaln 
distribuído com valor médio p, (o peso real do m 
pécime i) e variância cr 2 . 

a. Mostre que o estimador de máxima verossimil 
de cr 2 é cr 2 = X(X, - Y,) 2 /(4n). [Sugestão: se : = 
(z, + z 2 )/2, então, £(z, - z) 2 = (z, - z 2 ) 2 /2.] 

b. A emv & 2 é um estimador não-tendencioso de <r? 
Determine um estimador não-tendencioso de 
[Sugestão: para qualquer va Z E(Z 2 ) = V(Z) -I- [£(Z) 
Aplique a equação em Z = X, - Y,.] 
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Intervalos Estatísticos 
Baseados em uma 
Única Amostra 


[ Introdução 

Uma estimativa pontual, por ser um único número, não fornece por si mesma qualquer in- 
formação sobre a precisão e a confiabilidade da estimativa. Considere, por exemplo, o uso 
da estatística X para calcular a estimativa pontual da tensão de quebra média real (g) de 
toalhas de papel de certa marca e suponha que x = 9322,7. Devido à variabilidade da 
amostragem, virtualmente nunca é o caso de x = /*.. A estimativa pontual não diz nada so- 
bre o quanto pode estar próxima de /x. Uma alternativa para apresentar um único valor 
sensato para o parâmetro que está sendo estimado é calcular e relatar um intervalo com- 
pleto de valores plausíveis — uma estimativa de intervalo ou intervalo de confiança (IC). 
Um intervalo de confiança sempre é calculado selecionando-se primeiro o nível de confian- 
ça, que é uma medida do grau de confiabilidade do intervalo. Um intervalo de confiança 
com nível de confiança de 95% da tensão de quebra média real pode ter limite inferior de 
9162,5 e limite superior de 9482,9. Então, com nível de confiança de 95%, qualquer valor 
de /x entre 9162,5 e 9482,9 é plausível. O nível de confiança de 95% implica que 95% de 
todas as amostras forneceriam um intervalo que inclui /x, ou qualquer outro parâmetro que 
esteja sendo estimado, e apenas 5% de todas as amostras dariam um intervalo errôneo. 
Os níveis de confiança usados com mais freqüência são 95%, 99% e 90%. Quanto maior 
o nível de confiança, mais fortemente acreditamos que o valor do parâmetro que está 
sendo estimado está dentro do intervalo (a interpretação de qualquer nível de confiança 
específico será dada em breve). 

As informações sobre a precisão de uma estimativa de intervalo são transmitidas pela 
sua extensão. Se o nível de confiança for alto e o intervalo resultante, bastante restrito, 
nosso conhecimento do valor do parâmetro será razoavelmente preciso Um intervalo de 
confiança muito amplo, entretanto, passa a idéia de que há muita incerteza com relação 
ao valor do que estamos estimando. A Figura 7.1 mostra intervalos de confiança de 95% 
das tensões de quebra médias reais de duas marcas diferentes de toalhas de papel. Um 
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desses intervalos sugere conhecimento exato de /z, enquanto o outro sugere uma va- 
riedade bastante grande de valores plausíveis. 

Marca 1: - ■ ■( ) Resistência 

Marca 2: ( ) Resistência 

Figura 7.1 Intervalos de confiança que indicam informações precisas (marca 1) e imprecisas 
(marca 2) sobre m 


7.1 I Propriedades Básicas de Intervalos de Confiança 

Os conceitos básicos e as propriedades dos intervalos de confiança (ICs) são introduzidos mais facilmente enfo- 
cando primeiro uma situação de problema simples, embora um pouco irreal. Suponha que o parâmetro de inter- 
esse seja a média de uma população /x e que 

1. A distribuição da população é normal 

2. O valor do desvio padrão da população cr é conhecido 

A normalidade da distribuição populacional é geralmente uma suposição razoável. Entretanto, se o valor de 
fi é desconhecido, é improvável que o valor de o- esteja disponível (o conhecimento do centro de uma popul 
precede tipicamente informações relacionadas à dispersão). Nas seções posteriores, desenvolveremos mét 
com base em suposições menos restritivas. 

Exemplo 7.1 

Os engenheiros industriais que se especializam em ergonomia estão preocupados em projetar espaços e di„ 
sitivos operados por trabalhadores, de modo a obter maior produtividade e conforto. O artigo “Studies 
Ergonomically Designed Alphanumeric Keyboards” (Human Factors, 1985, p. 175-187) relata o estudo de 
tura preferida de um teclado experimental com grande apoio para o pulso e o antebraço. Uma amostra 
n = 31 digitadores treinados foi selecionada, e a altura preferida do teclado foi determinada para cada digi 
A altura preferida média resultante da amostra foi x = 80 cm. Assumindo que a altura preferida seja no 
mente distribuída com cr = 2 cm (valor sugerido pelos dados no artigo), obtenha um 1C para fi, a altura 
real preferida pela população de todos os digitadores experientes. 

As observações reais da amostra jcj, x 2 , .... x n são consideradas o resultado de uma amostra aleai 
Xj, .... X„ de uma distribuição normal com valor médio fi e desvio padrão cr. Os resultados do Capítulo 5, e 
implicam que, independentemente do tamanho da amostra n, a média amostrai X é normalmente distribuída 
valor esperado /x e desvio padrão o/Vn. Padronizar X subtraindo primeiro seu valor esperado e dividindo-o 
seu desvio padrão produz a variável 


2 = ^ M 

cr/Vn 


1 


que tem distribuição normal padronizada. Em virtude de a área sob a curva normal padrão entre —1,96 e 1 
ser 0,95, 

PÍ — 1 ,96 < 


^ — 1,96 < < l,9ój = 0,95 


Intervalos Estatísticos Baseados em uma Única Amostra - Jay L. Devore 247 


0 passo seguinte no desenvolvimento é manipular as desigualdades dentro dos parênteses em (7.2), para 
que apareçam sob a forma equivalente l < p,< u, em que os pontos finais leu envolvam X e cr/Vn. Isso é al- 
cançado por meio da seguinte seqüência de operações, cada uma produzindo desigualdades equivalentes às que 
iniciamos com: 

1. Multiplique por o/Vn para obter 


-1,96 • <X — p < 1,96- 

Vn ^ Vn 

2. Subtraia X de cada termo para obter 

-X - 1.96 • -7= < -p. < -X + 1,96 • A- 
Vn Vn 

3. Multiplique por -1 para eliminar o sinal negativo de p (que inverte a direção de cada desigualdade) para obter 

B X + 1,96 • -^= > n>X - 1,96 • 

isto é, 


X ~ 1,96 • ~^= < p < X + 1,96 • 

V7i Vii 

Em virtude de cada conjunto de desigualdades da seqüência ser equivalente ao original, a probabilidade as- 
sociada a cada um é 0,95. Em particular 

p(x- 1,96^ <p<X + l,96^j = 0,95 (7.3) 

0 evento dentro dos parênteses em (7.3) possui uma aparência um tanto desconhecida; antes a quantidade 
aleatória sempre apareceu no meio com constantes em ambas as extremidades, como emasfsi. Em (7.3), 
a quantidade aleatória aparece nas duas extremidades, enquanto a constante desconhecida fx aparece no meio. 
Para interpretar (7.3), imagine um intervalo aleatório que tem ponto final esquerdo X - 1,96 • cr/Vn e ponto 
final direito X + 1 ,96 • cr/Vn que, na notação de intervalo, é 

■ (7.4) 

0 intervalo (7.4) é aleatório porque seus dois pontos finais envolvem uma variável aleatória (va). Observe que 
o intervalo está centrado na média amostrai X e se estende 1 ,96 cr/Vn de cada lado de X. Dessa forma, a am- 
plitude do intervalo é 2 • (1,96) • cr/Vn, que não é aleatório; somente a posição do intervalo (seu ponto central 
X) é aleatória (Figura 7.2). Agora, (7.3) pode ser parafraseado como "a probabilidade de que o intervalo 
aleatório (7.4) inclua o valor real de p é 0,95 ”. Antes de qualquer experimento ser realizado e de quaisquer 
dados serem coletados, é bastante provável (probabilidade de 0,95) que p esteja dentro do intervalo na 
Expressão (7.4). 


1,96 a/y/n 1,96 a/y/Ti 


i i i 

X - 1 ,96(r/Vn X X -I- 1,96 aN n 


Figura 7.2 O intervalo aleatório (7.4) centralizado em X 
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DEFINIÇÃO 


Após observar X\ = x\, X 2 = x 2 , X n = x n , calculamos a média amostrai observada x e 
substituímos x em (7.4) no lugar de X; o intervalo fixo resultante é chamado intervalo de 
confiança de 95% de fi. Esse 1C pode ser expresso tanto como 


— 1 ,96 • , x + 1 ,96 • -^= j é um 1C de 95% de jx 


ou como 


x — 1 ,96 • -^ 7 = < fx < x + 1 ,96 • -fj= com 95% de confiança 


Uma expressão concisa para o intervalo é x ± 1,96 • oA/n, onde - é o ponto final es- 
querdo (limite inferior) e + é o ponto final direito (limite superior). 


Exemplo 7.2 (continuação do Exemplo 7.1) 

As quantidades requeridas para o cálculo do 1C de 95% da altura média real preferida são cr = 2,0, n = 3 1 e x = 
80.0. O intervalo resultante é 


3c ± 1,96 • ^ = 80.0 ± (1,96)-M, = 80,0 ± 0.7 = (79,3, 80,7) 


Isto é, podemos estar altamente confiantes, no nível de confiança de 95%, de que 79,3 < /x < 80,7. Esse inter- 
valo é relativamente restrito, indicando que /x foi estimado com precisão. I 


Interpretando um Intervalo de Confiança 

O nível de confiança de 95% do intervalo definido foi herdado da probabilidade de 0.95 do intervalo aleatório 

(7.4) . Os intervalos que têm outros níveis de confiança serão introduzidos em breve. Agora, no entanto, considere 
como a confiança de 95% pode ser interpretada. 

Em virtude de termos começado com um evento cuja probabilidade era 0,95 - que o intervalo aleatório, 

(7.4) incluiria o valor real de fi - e depois usado os dados do Exemplo 7. 1 para calcular o intervalo estabelecido 
(79,3, 80,7). é tentador concluir que fj. está dentro desse intervalo estabelecido com probabilidade de 0.95. Mas, 
substituindo x = 80.0 por X, toda a aleatoriedade desaparece; o intervalo (79,3, 80,7) não é aleatório e /x é uma 
constante (infelizmente desconhecida para nós), de modo que é errado escrever a expressão P( /jl está em (79,3, j 




80,7)) = 0,95. 

A interpretação correta da “confiança de 95%” baseia-se na interpretação de freqüência relativa de loi 
prazo da probabilidade; dizer que um evento A tem probabilidade de 0,95 significa dizer que. se o experim 
no qual A é definido for repetido várias vezes, em longo prazo, A ocorrerá 95% das vezes. Suponha que o 
nhamos outra amostra das alturas preferidas dos digitadores e calculemos outro intervalo de 95%. En' 
consideramos repetir o experimento para uma terceira amostra, para uma quarta e assim por diante. Seja A o 
evento em que X — 1 ,96 • o/Vn < /x < X + 1 ,96 • tr/Vn. Uma vez que P(A) = 0,95, em longo prazo, 95% de 
nossos ICs calculados conterão /x. Esta afirmativa é mostrada na Figura 7.3, onde a linha vertical corta o ei 
de medição no valor real (embora desconhecido) de fi. Observe que, dos 1 1 intervalos ilustrados, somente os 
intervalos 3 e 1 1 não contêm /x. Em longo prazo, somente 5% dos intervalos construídos desse modo 
contêm /x. 


Intervalos Estatísticos Baseados em uma Única Amostra - Jay L. Devore 


249 


Valor real de 

Intervalo 

número j 

(D ■ — I • 

(2) H • 

(3) H •— 

(4) — t h-« 

(5) «— I * 

(6) -i f» 

(7) «-H • 

(8) ü 1 

(9) *— I » 

(10) — « I— • 

( 11 ) • >1 

Figura 7.3 Construção repetida dos ICs de 95% 


Conforme essa interpretação, o nível de confiança de 95% não é tanto uma declaração sobre qualquer in- 
tervalo específico, como (79,3, 80,7), mas se refere ao que aconteceria se um número muito grande de interva- 
los semelhantes fosse construído. Embora isso possa parecer insatisfatório, a origem da dificuldade permanece 
com nossa interpretação de probabilidade; aplica-se a uma seqüência longa de replicações de um experimento 
em vez de apenas uma única replicação. Existe outra abordagem para a construção e interpretação de ICs que 
utiliza a noção de probabilidade subjetiva e o teorema de Bayes, mas os detalhes técnicos estão além do escopo 
deste texto; o livro de Winkler (veja a bibliografia do Capítulo 2) é uma boa fonte. O intervalo apresentado aqui 
(bem como cada intervalo apresentado subseqüentemente) é chamado IC “clássico”, pois sua interpretação de- 
pende da noção clássica de probabilidade (embora as idéias principais tenham sido desenvolvidas em um pas- 
sado relativamente recente, na década de 1930). 


Outros Níveis de Confiança 

0 nível de confiança de 95% foi herdado da probabilidade de 0,95 das desigualdades iniciais em (7.2). Se for 
desejado um nível de confiança de 99%, a probabilidade inicial de 0,95 deve ser substituída por 0,99, o que 
exige a mudança do valor crítico de z de 1,96 para 2,58. Um IC de 99% resulta, então, do uso de 2,58 no lugar 
de 1,96 na fórmula do IC de 95%. 

Essa afirmativa sugere que qualquer nível de confiança desejado pode ser alcançado substituindo-se 1,96 
ou 2,58 pelo valor crítico normal padronizado apropriado. Conforme mostra a Figura 7.4, a probabilidade de 
1 _ a é alcançada usando-se no lugar de 1 ,96. 




curva z 

- / 

N. 

1 - a Área sombreada = a/2 



~ Z a/2 0 z aíl 

Figura 7.4 P(-Z„ a s Z < z of2 ) = 1 - a 


DEFINIÇÃO 


O intervalo de confiança 100(1 — á)% da média fx de uma população normal, quando o 
valor de cr é conhecido, é dado por 

(*-2o/2-^* + Z«/2-^) (7.5) 

ou, de forma equivalente, por x ± Zan ' 
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Exemplo 7.3 

O processo de produção das unidades de caixa de controle de um tipo específico de motor foi modificado re- 
centemente. Antes dessa modificação, os dados históricos sugeriam que a distribuição dos diâmetros do orifício 
dos mancais nas caixas eram normais, com um desvio padrão de 0,100 mm. Acredita-se que a modificação não 
tenha afetado o formato da distribuição ou o desvio padrão, mas que o valor do diâmetro médio possa ter mu- 
dado. Uma amostra de 40 unidades da caixa é selecionada e o diâmetro do orifício é determinado para cada uma, 
resultando em um diâmetro médio da amostra de 5,426 mm. Vamos calcular um intervalo de confiança para o 
diâmetro médio real do orifício usando um nível de confiança de 90%. O procedimento requer que 100( 1 — á) = 
90, do qual a = 0,10 e z a/2 = z 0 ,05 = 1-645 (correspondendo a uma área acumulada da curva z de 0,9500). 0 
intervalo desejado é, então, 


5,426 ± (1,645) ° z ^ ) = 5,426 ± 0,026 = (5,400, 5,452) 

V40 

Com um grau razoavelmente alto de confiança, podemos dizer que 5,400 < /x < 5,452. Esse intervalo é bastan 
restrito, devido ao pequeno valor da variabilidade do diâmetro do orifício (cr = 0,100). 


Nível de Confiança, Precisão e Escolha do Tamanho da Amostra 

Por que seguir para um nível de confiança de 95% quando se pode chegar a um nível de 99%? Porque o pre- 
ço pago pelo nível de confiança maior é um intervalo mais largo. Em virtude de o intervalo de 95% estender-se 
1,96 • cr/Vn a cada lado de x, a amplitude do intervalo é 2(1,96) • er/Vn = 3,92 • cr/Vn. De maneira semc, 
lhante, a amplitude do intervalo de 99% é 2(2,58) • tr/Vn = 5,16 • cr/Vn. Isto é, temos mais confiança no in- 
tervalo de 99% exatamente porque é mais largo. Assim, quanto maior o grau de confiança desejado, mais laç 
é o intervalo resultante. Na verdade, o único IC de 100% para /x é (-*, =»), que não acrescenta grandes infor 
mações, pois, mesmo antes da amostragem, sabíamos que esse intervalo cobria /x. 

Se imaginarmos a amplitude do intervalo como a especificação de sua precisão ou acurácia, então seu nível 
de confiança (ou confiabilidade) estará inversamente relacionado à sua precisão. Uma estimativa altamente con- 
fiável do intervalo pode ser imprecisa, quando os pontos finais do intervalo estiverem muito distantes, enquan' 
um intervalo preciso pode exigir confiabilidade relativamente baixa. Dessa forma, não se pode dizer ineq 
vocamente que um intervalo de 99% será preferível a um intervalo de 95%; o ganho na confiabili 
exige uma perda na precisão. 

Uma estratégia interessante é especificar o nível de confiança desejado e a amplitude do intervalo e en" 
determinar o tamanho necessário da amostra. 

Exemplo 7.4 

O monitoramento extensivo de um sistema de computador de compartilhamento de tempo sugeriu que o tem L 
de resposta a um comando de edição específico é normalmente distribuído com desvio padrão de 25 milr 
gundos. Um novo sistema operacional foi instalado e desejamos estimar o tempo de resposta médio real ji àa 
novo ambiente. Assumindo que os tempos de resposta ainda sejam normalmente distribuídos com cr - 25, que 
tamanho de amostra é necessário para garantir que o IC de 95% resultante tenha uma amplitude de (no máx" 
10? O tamanho da amostra n deve satisfazer 


O reajuste dessa equação fornece 


10 = 2 • ( 1 ,96)(25/Vn) 


Vn = 2 • (1,96)(25)/10 = 9,80 


então 


n = (9,80) 2 = 96,04 

Uma vez que n deve ser um número inteiro, é necessário um tamanho de amostra de 97. 
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A fórmula geral do tamanho da amostra n necessária para garantir uma amplitude de intervalo w é obtida 
de w = 2 • z a /2 ' oA /w, já que 



Quanto menor a amplitude desejada w, maior deve ser n. Além disso, n é uma função crescente de tr (maior 
variabilidade da população precisa de um tamanho de amostra maior) e do nível de confiança 100( 1 — a) (à me- 
dida que a diminui, z^ aumenta). 

A metade da amplitude 1,96 o/Vn do IC de 95% é chamada às vezes de limite do erro de estimação as- 
sociado a um nível de confiança de 95%; isto é, com confiança de 95%, a estimativa pontual x não estará mais 
distante de /x do que este valor. Antes de obter os dados, o investigador pode desejar determinar o tamanho de 
uma amostra para o qual é obtido um valor específico do limite. Por exemplo: com /x representando o consumo 
médio de combustível (milhas/galão) de todos os carros de um determinado tipo, o objetivo de uma investigação 
pode ser estimar fx dentro de um intervalo de confiança de 95% de 1 milha/galão. Geralmente, se desejamos es- 
timar jti para um valor B (o limite especificado do erro de estimação) com confiança de 100(1— a)%, o tamanho 
da amostra necessário resulta da substituição de 2/w por 1 IB na fórmula da caixa precedente. 

Derivando um Intervalo de Confiança 

Sejam X,, X 2 , ..., X rl , a amostra na qual o IC de um parâmetro 9 se baseará. Suponha que uma variável aleatória 
que satisfaça às duas propriedades a seguir possa ser encontrada: 

1. A variável depende funcionalmente de X,, ..., X n e 8. 

2. A distribuição de probabilidade da variável não depende de 9 ou de quaisquer outros parâmetros des- 
conhecidos. 

Seja A(X), X 2 ..., X„; 8) essa variável aleatória. Por exemplo: se a distribuição da população for normal com 
trconhecido e 0 = /r, a variável h(X x , ..., X„; fi) = (X — /i)/(cr/Vn) satisfaz ambas as propriedades; sua forma 
funcional claramente depende de fx, ainda que tenha distribuição de probabilidade normal padronizada, que não 
depende de /x. Em geral, a forma da função h é sugerida examinando-se a distribuição de um estimador apro- 
priado d. 

Para qualquer a entre 0 e 1 , podem ser determinadas constantes a e b que satisfaçam a 

P(a < h(X { , ..., X n ; 8) <b)= l - a (7.6) 

Devido à segunda propriedade, a e b não dependem de 9. No exemplo normal, a = ~z a p_ e b = z^. Agora, 
suponha que as desigualdades em (7.6) possam ser manipuladas para isolar 9, fornecendo a probabilidade 

equivalente 


x 2 X„) < 8 < u(X„ X 2 X„)) = 1 - a 

Então, /(jq, x 2 , ..., x n ) e u(x { , ..., x n ) são os limites de confiança inferior e superior, respectivamente, de um IC de 
100(1 — á)%. No exemplo normal, vimos que /(X), ..., X„) = X — • cr/Vn e u(X { , ..., X„) = X + z^ • 

oA/n. 

fxemplo 7.5 

Um modelo teórico sugere que o tempo de quebra de um líquido isolante entre eletrodos em uma voltagem 
específica tem distribuição exponencial com parâmetro À (veja a Seção 4.4). Uma amostra aleatória de 
» = 10 tempos de quebra produz os seguintes dados amostrais (em min): jc, = 41,53, x 2 = 18,73, x 3 = 2,99, 
*4 = 30.34, x 5 = 12,33, x 6 = 1 17,52, x 7 = 73,02, jc 8 = 223,63, x 9 = 4,00, jr 10 = 26,78. Um IC de 95% de A e 
Jo tempo de quebra médio real são desejados. 
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Seja h(X\ % X 2 X n ; À) = 2 Á^Xj. Demonstra-se que essa variável aleatória possui uma distribuição de 

probabilidade chamada distribuição qui-quadrada com 2 n graus de liberdade (gl) (v = 2 n, onde í^éo parâmetro 
da distribuição qui-quadrada, conforme discutido na Seção 4.4). A Tabela A.7 do Apêndice ilustra uma curva de 
densidade qui-quadrada típica e tabula valores críticos que incluem as áreas de cauda especificadas. O número 
relevante de graus de liberdade neste caso é 2(10) = 20. A linha v = 20 da tabela mostra que 34,170 inclui a 
área sob a cauda superior 0,025 e 9,591 inclui a área sob a cauda inferior 0,025 (área sob a cauda superior 0,975). 
Assim, para n = 10, 


P(9,591 < 2AZX, < 34,170) = 0,95 
Divisão por 2 2*) isola À, produzindo 

P(9, 59 1/(22*,) < A < (34,170/(22*,)) = 0,95 

O limite inferior do 1C de 95% de A é 9,591/(22*,). e ° limite superior é 34,170/(22*,). Para os dados forneci- 
dos, 'Z.Xj = 550,87, dando o intervalo (0,00871, 0,03101). 

O valor esperado de uma va exponencial é p,= 1/A. Uma vez que 

P( 2X^/34,170 < i/ A < 22*79,591) = 0,95 

o 1C de 95% do tempo de quebra médio real é (22*,/34,170, 22*/9,591) = (32,24, 1 14,87). Esse intervalo é 
evidentemente bastante largo, refletindo variabilidade substancial nos tempos de quebra e o tamanho de uma 
amostra pequena. ■ 


Em geral, os limites de confiança superior e inferior resultam da substituição de cada < em (7.6) por = e 
da resolução de 0. No exemplo do fluido isoiante considerado, 2A2-t, = 34, 170 fornece A = 34, 1 70/(22*,) como 
o limite de confiança superior e o limite inferior, obtidos da outra equação. Observe que os dois limites do in- 
tervalo não são equidistantes da estimativa pontual, uma vez que o intervalo não é da forma 6 ± c. 


Intervalos de Confiança Bootstrap 

A técnica bootstrap foi introduzida no Capítulo 6 como uma forma de estimar crç. Também pode ser aplicada 
para se obter um IC de 6. Considere novamente aestimação da média p de uma distribuição normalquandoff 
é conhecido. Vamos substituir p por 0 e usar 6 = X comc 
percentil da distribuição de 0 - 0 [isto é, P(X - p < 1 
lhante, -1,96 o/Vn é o 2,5“ percentil, assim 

0,95 = P(2,5“ percentil < 0 — 0 < 97,5“ percentil) 

= P{0 — 2,5“ percentil > 0 > 0 - 97,5“ percentil) 



Isto é, com 


/ = Ô — 97,5“ percentil de 0 — 0 
u = 0 - 2,5“ percentil de 0 — 0 
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Exercícios I Seção 7.1 (1-1 1) 

1. Considere a distribuição de uma população normal com 
o valor de a conhecido. 

a. Qual é o nível de confiança do intervalo 3t ± 
2,81<r/Vn? 

b. Qual é o nível de confiança do intervalo 3c ± 
1,44o/ Vã? 

c. Que valor de na fórmula do IC (7.5) resulta em 
um nível de confiança de 99 ,7%? 

d. Responda à pergunta proposta no item (c) para um 
nível de confiança de 75%. 

2. Cada um dos intervalos a seguir é um intervalo de con- 
fiança de /z = média real (isso é, média da população) 
dafreqüência de ressonância (Hz) de todas as raquetes 
de tênis de um determinado tipo: 

(114,4, 115,6) (1 14,1, 1 15,9) 

a. Qual é o valor da freqüência de ressonância da mé- 
dia amostrai? 

b. Ambos os intervalos foram calculados a partir dos 
mesmos dados amostrais. O nível de confiança de 
um desses intervalos é 90% e do outro é 99%. Qual 
dos intervalos possui o nível de confiança de 90% e 
por quê? 

3. Suponha que uma amostra aleatória de 50 garrafas de 
uma marca específica de xarope para tosse seja selecio- 
nada e o teor alcoólico de cada garrafa seja determinado. 
Seja /x o teor médio de álcool da população de todas as 
garrafas da marca em estudo. Suponha que o intervalo de 
confiança de 95% resultante seja (7,8, 9,4). 

a. Um intervalo de confiança de 90% calculado dessa 
mesma amostra teria sido mais estreito ou mais lar- 
go que o intervalo mencionado acima? Explique 
seu raciocínio. 

b. Considere a afirmação a seguir: existe 95% de 
chance de /z estar entre 7,8 e 9,4. Essa afirmação está 
correta? Por quê? 

c. Considere a afirmação a seguir: podemos estar cer- 
tos de que 95% de todas as garrafas desse tipo de 
xarope têm um conteúdo alcoólico que está entre 7,8 
e 9,4. A afirmação está correta? Por quê? 

<L Considere a afirmação a seguir: se o processo de se- 
leção de uma amostra de tamanho 50 e de cálculo do 
intervalo de 95% correspondente for repetido 100 
vezes, 95 dos intervalos resultantes incluirão /z. Essa 
afirmação está correta? Por quê? 

4. Deseja-se um IC para a média real da perda de carga 
por dispersão /z (watts) de um tipo de motor a indução, 
quando a corrente da linha é mantida em 10 amps para 
uma velocidade de 1500 rpm. Assuma que a perda de 
carga por dispersão seja normalmente distribuída com 
d = 3,0. 

a. Calcule um IC de 95% de /z quando n = 25 e 
x = 58,3. 


b. Calcule um IC de 95% de /z quando n = 100 e 
x = 58,3. 

c. Calcule um IC de 99% de /z quando n = 100 e 
3c = 58,3. 

d. Calcule um IC de 82% de /z quando n = 100 e 

3c = 58,3. 

e. Quão grande deve ser n se a largura do intervalo de 
99% de /z for 1,0? 

5. Assuma que a porosidade do hélio (em porcentagem) 
das amostras de carvão tiradas de qualquer junta es- 
pecífica seja normalmente distribuída com desvio 
padrão real de 0,75. 

a. Calcule um IC de 95% da porosidade média real de 
uma junta, caso a porosidade média de 20 de seus es- 
pécimes seja 4,85. 

b. Calcule um IC de 98% da porosidade média real de 
outra junta com base nos 16 espécimes com média 
amostrai de porosidade de 4,56. 

c. Quão grande o tamanho de uma amostra deve ser se 
a amplitude do intervalo de 95% for 0,40? 

d. Que tamanho de amostra é necessário para estimar a 
porosidade média real dentro de 0,2 com confiança 
de 99% ? 

6. Com base em testes extensivos, o ponto de escoamento 
de um tipo específico de barra de aço reforçado é co- 
nhecido por ser normalmente distribuído com cr = 100. 
A composição da barra foi levemente modificada, mas 
acredita-se que essa modificação não tenha afetado nem 
a normalidade e nem o valor de a. 

a. Assumindo que esse seja o caso, se uma amostra de 
25 barras modificadas tiver resultado em um ponto 
de escoamento médio amostrai de 8439 lb, calcule 
um IC de 90% para o ponto de escoamento médio 
real da barra modificada. 

b. Como você modificaria o intervalo no item (a) para 
obter um nível de confiança de 92%? 

7. Em quanto o tamanho da amostra n deve ser aumentado 
se a amplitude do IC (7.5) for reduzida à metade? Se o 
tamanho da amostra for aumentado por um fator de 25, 
que efeito terá sobre a amplitude do intervalo? Justi- 
fique suas afirmações. 

8. Seja üfj > 0, a 2 > 0, com a { + a 2 = a. Então, 

P {~ Za ' < Õ/Vn < Zcn ) = 1 ~ “ 

a. Use essa equação para deduzir uma expressão mais 
geral para um IC de 100(1 — a)% de /z do qual o in- 
tervalo (7.5) é um caso especial. 

b. Seja a = 0,05 e «j = a/4, a 2 = 3a/4. Essa con- 
dição resulta em um intervalo mais estreito ou mais 
largo que o intervalo (7.5)? 
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9. a. Sob as mesmas condições que as que levam ao in- 


a. Assuma que a distribuição da vida útil seja exponen- 
cial e use um argumento paralelo ao do Exemplo 7.5 
para obter um IC de 95% da vida útil esperada (mé- 
dio real). 


tervalo (7.5), P[(X - fi)/( a/Vn) < 1,645] = 0.95. 


Use isso para deduzir um intervalo unilateral de /z 
que possui amplitude infinita e fornece um limite de 
confiança inferior em /z. Que intervalo é esse para os 
dados do Exercício 5(a)? 


b. Como o intervalo do item (a) deve ser alterado para 
chegar a um nível de confiança de 99%? 


b. Generalize o resultado do item (a) para obter um c * ° c > ue . é ° ,C de 95% ^ 0 de _ svio P adrão da dis - 


fornece um limite superior em /z? Calcule esse in- U. Considere os próximos 1000 ICs de 95% de /z que um 


10. Uma amostra aleatória de n = 1 5 determinados tipos de * baseiam sejam se | e cionados independentemente um 


O IC de /u dado na seção anterior assumiu que a distribuição da população é normal e que o valor de a é co- 
nhecido. Apresentamos agora o IC de uma amostra grande, cuja validade não exige essas hipóteses. Depois de 
mostrar como o argumento que leva a esse intervalo é generalizado para produzir outros de amostra grande, abor 
damos o intervalo da proporção de uma população p. 

Um Intervalo de Amostra Grande para p 

Sejam X], X 2 , X„ uma amostra aleatória de uma população que tem média p e desvio padrão a. Desde que/t 
seja grande, o Teorema do Limite Central (TLC) implica que X tem aproximadamente distribuição normal, qual- 
quer que seja a natureza da distribuição da população. Segue então que Z = (X - p)l(arlVn) possui ap 
ximadamente distribuição normal padrão, de modo que 


anteriormente permanece válido, qualquer que seja a distribuição da população, contanto que o adjetivo “a; 
ximadamente” se insira na frente do nível de confiança. 

Uma dificuldade prática com esse desenvolvimento é que o cálculo do intervalo exige o valor de cr, q 
quase nunca será conhecido. Considere a variável padronizada 


em que o desvio padrão amostrai S substitui o*. Havia anteriormente aleatoriedade somente no numerador de 
(em virtude de X). Agora, existe aleatoriedade no numerador e no denominador - os valores de X e S variam d 
amostra para amostra. Entretanto, quando n é grande, o uso de S em vez de o- acrescenta pouca variabilidade en- 
tra a Z. Mais especificamente, nesse caso, o novo Z também possui aproximadamente uma distribuição no* 
padronizada. A manipulação das desigualdades para probabilidades que utilizam esse novo Z produz um in 
valo geral de amostras grandes para p. 


limite inferior com nível de confiança 1 00( 1 — a)%. 

c. Qual é o intervalo análogo ao do item (b) que 


tribuição da vida útil? ( Sugestão : qual é o desvio 
padrão de uma variável aleatória exponencial?) 


tervalo de 99% para os dados do Exercício 4(a). 


consultor estatístico obterá para vários clientes. Su- 
ponha que os conjuntos de dados em que os intervalos 


bombas de aquecimento produziu as seguintes obser- 
vações sobre a vida útil (em anos): 


do outro. Quantos desses 1000 intervalos capturamos 
valores correspondentes de /z? Qual é a probabilidade. 


2,0 1,3 6,0 1,9 5,1 0,4 1,0 5,3 



15,7 0,7 4,8 0,9 12,2 5,3 0,6 


correspondente de /z? ( Sugestão : seja Y = número de 
intervalos entre os 1000 que contém p. Que tipo de va- 
riável aleatória é K?) 


7.2 Intervalos de Confiança para Amostras Grandes 
para uma Média e Proporção da População 
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PROPOSIÇÃO 


Se n é suficientemente grande, a variável padronizada 

z = Inü 

s/Vh 

possui aproximadamente uma distribuição normal padronizada. Isso implica que 




(7.8) 


é um intervalo de confiança de amostra grande para /* com nível de confiança de 
aproximadamente 100( 1 — a)%. Essa fórmula é válida independentemente do formato da 
distribuição da população. 


Geralmente, n > 40 será suficiente para justificar o uso desse intervalo. Essa afirmação é mais conservadora que 
a regra prática para o TLC, devido à variabilidade adicional introduzida, usando-se S em vez de cr. 

Exemplo 7.6 

A voltagem de quebra da Corrente Alternada (CA) de um líquido isolante indica sua resistência dielétrica. O ar- 
tigo ‘Testing Practices for the AC Breakdown Voltage Testing of Insulation Liquids” (IEEE Eléctrica! Insula- 
tion Magazine, 1995, p. 21-26) forneceu as seguintes observações amostrais da voltagem de quebra (kV) de um 
circuito específico sob certas condições. 
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Um bo.xplot dos dados (Figura 7.5) mostra alta concentração central dos dados (largura estreita da caixa). Há um 
único outlier na extremidade superior, mas esse valor está realmente um pouco mais próximo da mediana (55) 
que a observação da amostra menor. 


1 | 1 1 ► Voltagem 

40 50 60 70 

Figura 7.5 Um boxplot para os dados da voltagem de quebra do Exemplo 7.6 


As quantidades resumidas incluem n = 48, = 2626 e = 144,950, pelas quais x = 54,7 e s = 5,23. 

0 intervalo de confiança de 95% é então 


Isto é, 


54,7 ± 1,96^| = 54,7 ± 1,5 = (53,2, 56,2) 
53,2 <ti< 56,2 


com um nível de confiança de aproximadamente 95%. O intervalo é razoavelmente estreito, indicando que esti- 
mamos n com precisão. ■ 
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Infelizmente, a escolha do tamanho da amostra para produzir a largura desejada de um intervalo não é tão 
direta aqui como foi para o caso de sigma conhecido. Isso se deve ao fato de a largura de (7.8) ser Iz^s/y/n. 
Uma vez que o valor de s não está disponível antes da coleta dos dados, a amplitude do intervalo não pode ser 
determinada somente pela escolha de n. A única opção para um investigador que quer especificar uma amplitude 
desejada é fazer uma estimativa sensata sobre qual pode ser o valor de s. Sendo conservador e estimando ura 
valor maior de s, será escolhido um n maior do que o necessário. O investigador pode ser capaz de especificar 
um valor razoavelmente preciso para a amplitude da população (a diferença entre os valores menor e maior). En- 
tão, se a distribuição da população não estiver muito distorcida, dividir a amplitude por 4 proporciona um valor 
aproximado de s. 

Exemplo 7.7 

Consulte o Exemplo 7.6 sobre a voltagem de quebra. Suponha que o investigador acredite que, virtualmente, to- 
dos os valores da população estejam entre 40 e 70. Então, (70 — 40)/4 = 7,5 é um valor razoável de s. O tamanho 
apropriado da amostra para estimar a média real da voltagem de quebra para dentro de 1 kV com nível de con- 
fiança de 95% — isto é, para o IC de 95% ter amplitude de 2 kV — é 

n = [(1,96)(7,5)/1] 2 = 217 ■ 

Um Intervalo de Confiança Geral para Amostra Grande 

Os intervalos de amostra grande x ± z^ • o7Vn tx± z^i * i/Vn são casos especiais de IC geral para amostra 
grande para um parâmetro 9. Suponha que 9 seja um estimador que satisfaça às seguintes propriedades: (1) Pos- 
sui distribuição aproximadamente normal; (2) é (pelo menos aproximadamente) não-tendencioso; e (3) está 
disponível uma expressão de <xg, o desvio padrão de 9. Por exemplo: no caso 0 = p., fx = X é um estimador não- 
tendencioso cuja distribuição é aproximadamente normal quando n é grande e = o* = o/Vn. Padronizar# 
produz a va Z = (ê - 6)/cr g que possui distribuição aproximadamente normal padronizada. Isso justifica a de- 
claração de probabilidade. 


P (-ZaJ2 < < Zatf) ** 1 “ * 


( 7 . 9)1 


Suponha, primeiro, que <rg não utilize quaisquer parâmetros desconhecidos (por exemplo: a conhecido no 
caso 6 = p). Então, substituir cada < em (7.9) por = resulta em 9 = Ô ± z^ • erg, de modo que os limites de 
confiança inferior e superior são Ô — z^ • cr g e 0 + z^ • <rg, respectivamente. Agora, suponha que erg não utiliz 
6, mas que use pelo menos outro parâmetro desconhecido. Considere que sg seja a estimativa de erg obtida usan- 
do-se estimativas em vez de parâmetros desconhecidos (por exemplo: i/Vn estima o/Vn). Sob condições geri 
(essencialmente que sg esteja próximo de erg para a maioria das amostras), um IC válido é 6 ± z^ • íg. O inter- 
valo x ± Za /2 • síXÍri é um exemplo. 

Finalmente, suponha que erg utilize o 6 desconhecido. Esse é o caso, por exemplo, quando 6 = p, uma pro- 
porção da população. Então, (9 — 9)la g = z a /i pode ser difícil de resolver. Uma solução aproximada geraln 
pode ser obtida substituindo-se 9 em erg por sua estimativa 9. Resulta, pois, um desvio padrão estimado íg c 
o intervalo correspondente é novamente 9 ± z^i ‘ s fr 

Um Intervalo de Confiança para uma Proporção da População 

Seja p a proporção de “sucessos” de uma população em que sucesso identifica um indivíduo ou objeto que tenha 
uma propriedade especificada. Uma amostra aleatória de n indivíduos será selecionada e X é o número de suc 
sos na amostra. Contanto que n seja pequen o, em comp aração ao tamanho da população, X pode ser conside 
uma va binomial com E(X) = npe cr x = X/np( 1 — p). Além disso, se n for grande ( np 2: 10 e nq 2: 10), X pos- 
sui distribuição aproximadamente normal. 

O estimador natural de p é p = X/n, a fração de sucessos da amostra. Uma vez que p é apenas X multi 
cado pela constante l/n, p também tem distribuição aproximadamente normal. Como mostrado na Seção 6. 
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E(p) = P (não-tendencioso) e = Vp( 1 — p)/n. O desvio padrão a p utiliza o parâmetro desconhecido p. 
Padronizar p , pela subtração de p e divisão por a r implica, então, que 


Prosseguindo conforme foi sugerido na subseção “Derivando um Intervalo de Confiança” (Seção 7.1), os 
limites de confiança resultam da substituição de cada < por = e resolvendo a equação quadrática resultante de 
p. Obtêm-se as duas raízes 


P = 


P + 


tsü ± z n 

2n ar2 \n 


H + Zoll. 

4n 2 


1 + (zhtn)ln 


PROPOSIÇÃO 


0 intervalo de confiança para uma proporção da po 

de aproximadamente 1 00( 1 — a)% tem 

..... „ . , . 

pulação p com nível de confiança 

'êk + àuL 

n 4 n 2 

limite de coníiânçâ inferior , . , 

1 + (zirt. 

e 

í + + 

)/n 

(7.10) 

/m + A 2. 

1 n 4n 2 

nume uc lumiaii^a , 

1 + \íanV n 


Se o tamanho da amostra for muito grande, z 2 /{2n) é desprezível, comparado a p, r/(4 n 2 ) sob a raiz quadrada é 
desprezível se comparado a pq/n , e z 2 ln é desprezível se comparado a 1 . Desconsiderando esses termos des- 
prezíveis obtemos os limites de confiança aproximados 


P ± z^VMTn ( 7 . 11 ) 

Essa expressão tem a forma geral Ô ± à§ de um intervalo de amostra grande sugerido na última subseção. 
Durante décadas, o intervalo acima foi recomendado, desde que a aproximação normal de p fosse justificada. 
Entretanto uma pesquisa recente mostrou que o intervalo um tanto mais complicado dado na proposição tem um 
nível de confiança real que tende a estar mais próximo do nível nominal do que o intervalo tradicional ( Agresti, 
Alan e Coull, “Approximate Is Better Than ‘Exact’ for Interval Estimation of a Binomial Proportion.” The Ame- 
rican Statistician . 1998. p. 1 19-126). Isto é, se z „/2 = 1-96 for usado, o nível de confiança do “novo” intervalo 
tende a estar mais próximo de 95% para quase todos os valores de p que é o caso do intervalo tradicional; isto 
também acontece com outros níveis de confiança. Além disso, Agresti e Coull afirmam que o intervalo “pode ser 
recomendado para uso em aproximadamente todos os tamanhos de amostra e valores de parâmetro”, de modo 
que as condições np S 10 e m) > 10 não precisem ser verificadas. 
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0,333 + (l,96) 2 /96± l,96V(0,333)(0,667)/48 + (1,96 r/9216 _ 0,373 ±0,1 39 
1 + (l,96) 2 /48 ~~ 1,08 


(0,217, 0,474 ) 


O intervalo tradicional é 


0,333 ± 1 ,96 V(0,333) (0.667 )/48 = 0,333 ± 1,33 = (0,200,0,466) 

Esses dois intervalos estariam muito mais próximos entre si se o tamanho da amostra fosse substancial- 
mente maior. ■ 

Igualar a amplitude do IC de p a uma amplitude pré-especificada w fornece uma equação quadrática para 
o tamanho da amostra n necessário para fornecer um intervalo com grau de precisão desejado. Eliminando-se o 
índice de z„ /2 , a solução é 

_ Izrpg — z 2 h ,: ± V4 z 4 p<y(pg — w 2 ) -l- w ~z 4 

w 2 

Desprezando os termos do numerador que envolvem vv 2 , temos 


(7.12* 


4z : w 
n ~ — L f L - 


w 

Essa última expressão é o resultado da igualdade da amplitude do intervalo tradicional com w. 

Essas fórmulas infelizmente envolvem p desconhecido. A abordagem mais conservadora é tirar proveito do 
fato de pq [= p(l - p)] ser um máximo quando p = 0,5. Assim, se p = q = 0,5 for usado em (7.12), a ampli- 
tude será no máximo w, independentemente do valor de p que resulte da amostra. De maneira alternativa, se o 
investigador acredita fortemente, com base em informações anteriores, que p < p 0 < 0,5, então p 0 pode ser usa- 
do no lugar de p. Um comentário semelhante se aplica quando p > p 0 > 0,5. 

Exemplo 7.9 

A amplitude do IC de 95% do Exemplo 7.8 é 0,257. O valor de n necessário para garantir uma amplitude de 0,10 
sem considerar o valor de p é 


2( 1,96) 2 (0,25) - ( 1,96) 2 (0,01 ) ± V4( 1,96 ) 4 (0.25) (0.25 - 0.01) + (0.01 )( 1.96 ) 4 

õõi “ 

Dessa forma, deve ser usado um tamanho de amostra de 381. A expressão de n com base no IC tradicion 
fornece um valor levemente maior de 385. í 


Intervalos de Confiança Monocaudais (Limites de Confiança) 

Os intervalos de confiança discutidos até agora fornecem tanto um limite de confiança inferior como um limite I 
de confiança superior para o parâmetro que está sendo estimado. Em algumas circunstâncias, o investigador vai J 
querer somente um desses dois tipos de limites. Por exemplo: um psicólogo pode querer calcular o limite de con- 
fiança superior de 95% para o tempo de reação médio real a um estímulo específico, ou um engenheiro de confia- 1 
bilidade pode querer somente o limite de confiança inferior da vida útil média real de um determinado tipo de 
componente. Em virtude de a área acumulada sob a curva normal padrão à esquerda de 1 .645 ser 0,95, 


< 1.645 
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Manipular a desigualdade dentro dos parênteses para isolar /jl em um lado e substituir as vas pelos valores cal- 
culados fornece a desigualdade p. > x — 1,645 í/Vrt; a expressão à direita é o limite de confiança inferior dese- 
jado. Começar com P(-l,645 < Z) = 0,95 e manipular a desigualdade resulta no limite de confiança superior. 
Um argumento semelhante fornece o limite monocaudal associado a qualquer outro nível de confiança. 


PROPOSIÇÃO 


O limite de confiança superior de amostra grande para p é 


M < x + Z a • 


Vn 


e o limite de confiança inferior de amostra grande para p é 


!±>x-z a 


Vn 


O limite de confiança monocaudal para p resulta da substituição de Zan por z a e ± por 
+ ou - na fórmula do IC (7.10) para p. Em todos os casos, o nível de confiança é de 
aproximadamente 100(1 — a)%. 


emplo 7.10 

0 teste de corte inclinado é o procedimento mais amplamente aceito para avaliar a qualidade de uma ligação en- 
tre um material de conserto e seu substrato de concreto. O artigo “Testing the Bond Between Repair Materials 
and Concrete Substrate” (AC/ Materials J., 1996, p. 553-558) relatou que, em uma investigação específica, uma 
amostra de 48 observações de resistência de corte forneceu uma resistência média amostrai de 17,17 N/mm- e 
um desvio padrão da amostra de 3,28 N/mm-. O limite de confiança inferior para a resistência de corte média 
real g com nível de confiança de 95% é 

17,17 - O’ 645 )^^ = 17 ’ 17 “ °’ 78 = 16,39 

Isto é. com um nível de confiança de 95%, o valor de n esta no intervalo (16,39, <*). ■ 


Exercícios | Seção 7.2 (12-27) 

12, Uma amostra aleatória de 110 relâmpagos, em certa 
região, resultou em uma duração média do eco do radar 
da amostra de 0,81 s. e um desvio padrão da amostra de 
0,34 s. (“Lightning Strikes to an Airplane in a Thunder- 
slorm" J. of Aircraft, 1984, p. 607-611). Calcule o in- 
tervalo de confiança (bicaudal) de 99% para a duração 
média real do eco /jl, e interprete o intervalo resultante. 

13. 0 artigo “Extravisual Damage Detection? Defining the 
Standard Normal Tree” ( Photogrammetric Engr and 
Remate Sensing, 1981, p. 515-522) discute o uso de fo- 
tografia infravermelha colorida na identificação de ár- 
vores normais nos grupos de pinheiros Douglas. Dentre 
os dados relatados, estava a estatística resumida das 
medições densitométricas ópticas analíticas de filtro 
verde nas amostras de árvores doentes e saudáveis. Para 


uma amostra de 69 árvores saudáveis, a densidade da 
camada colorida média amostrai era 1 ,028, e o desvio 
padrão da amostra, 0,163. 

a. Calcule um IC (bicaudal) de 95% para a densidade 
da camada colorida média real de todas as árvores. 

b. Suponha que os investigadores tenham feito uma 
adivinhação grosseira de 0, 16 para o valor de s antes 
de coletar os dados. Que tamanho de amostra seria 
necessário para obter uma amplitude do intervalo de 
0,05, para um nível de confiança de 95%? 

14, O artigo “Evaluating Tunnel Kiln Performance” (Amer 
Ceramic Soc. Buli . , ago. 1997, p. 59-63) forneceu as 
seguintes informações resumidas das resistências a 
fraturas (Mpa) de n = 169 barras cerâmicas cozidas 
em um determinado forno: x = 89,10, s = 3,73. 


r 

i 
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a. Calcule o intervalo de confiança (bicaudal) para a re- 
sistência à fratura média real, usando um nível de 
confiança de 95%. Parece que a resistência à fratura 
média real foi estimada com precisão? 

b. Suponha que os investigadores acreditaram a priori 
que o desvio padrão da população era cerca de 4 
MPa. Com base nessa suposição, quão grande deve 
ser uma amostra para calcular p dentro de 0.5 MPa 
com confiança de 95 %? 

15. Determine o nível de confiança para cada um dos limi- 
tes de confiança monocaudais de amostras grandes 
a seguir: 

a. Limite superior: x + 0,84s/Vn 

b. Limite inferior: x — 2,05 s/Vn 

c. Limite superior: x + 0,67 s/Vn 

16. O tempo entre a carga e o final do processo (min) de um 
aço carbono em um tipo de fornalha aberta foi determi- 
nado para cada aquecimento em uma amostra de ta- 
manho 46, resultando um tempo médio amostrai de 
382,1 e um desvio padrão da amostra de 31,5. Calcule 
o limite de confiança superior de 95% do tempo médio 
real entre a carga e o final do processo. 

17. O Exercício 1.13 forneceu uma amostra de observações 
da resistência extrema à tensão (ksi). Use a saída da 
estatística descritiva do MINITAB a seguir para calcu- 
lar o limite de confiança inferior de 99% para a re- 
sistência extrema à tensão média real e interpretar 
o resultado. 

N Média Mediana Média Ap Desv Padrào Média SE 
153 135,39 135,40 135,41 4,59 0,37 

Minimo Máximo Q1 Q3 

122,20 147,70 132,95 138,25 

18. O artigo “Ultimate Load Capacities of Expansion An- 
chor Bolts” (J. of Energy Engr t 1993, p. 139-158) 
forneceu os seguintes dados resumidos sobre a resistên- 
cia de corte (kip) de uma amostra de pinos de ferro de 
3/8-pol.: n = 78, x = 4,25, s = 1,30. Calcule o limite 
de confiança inferior, usando um nível de confiança de 
90% para a resistência de corte média real. 

19. O artigo “Limited Yield Estimation for Visual Defect 
Sources” (IEEE Trans. on Semiconductor Manuf. , 1997, 
p. 17-23) relatou que, em um estudo do processo de ins- 
peção de um wafer específico, 356 dados foram exami- 
nados por uma inspeção e 201 deles foram aprovados. 
Assumindo um processo estável, calcule o intervalo de 
confiança (bicaudal) de 95% para a proporção de todos 
os dados que foram aprovados pela inspeção. 

20. A Associated Press (9 de outubro de 2002) relatou que 
em uma inspeção de 4722 jovens americanos, com idade 
entre 6 e 19 anos, 15% estavam seriamente acima do 
peso (índice de massa corporal de pelo menos 30; esse 
índice é uma medida do peso em relação à altura). Cal- 
cule e interprete um intervalo de confiança, usando um 
nível de confiança de 99% para a proporção de todos os 
jovens americanos que estão seriamente acima do peso. 


21. Uma amostra aleatória de 539 lares de certa cidade do 
Meio-Oeste foi selecionada e determinou-se que em 
133 deles havia pelo menos uma arma de fogo (“The 
Social Determinants of Gun Ownership: Self-Protec- 
tion in an Urban Environment", Criminology, 1997, p. 
629-640). Usando um nível de confiança de 95%, cal- 
cule o limite de confiança inferior para a proporção de 
todos os lares dessa cidade que possuam no mínimo 
uma arma de fogo. 

22. Uma amostra aleatória de 487 mulheres não-fumantes 
de peso normal (índice de massa corporal entre 19,8 e 
26,0) que deram à luz em um grande centro médico 
metropolitano foi selecionada (“The Effects of Ciga- 
rette Smoking and Gestational Weight Change on Birth 
Outcomes in Obese and Normal-Weight Women"J 
Amer. J. of Public Health , 1997, p. 591-596). Determi-J 
nou-se que 7,2% desses partos resultaram em crianças 
com baixo peso (menos de 2500 g). Calcule o limite de 
confiança superior, usando um nível de confiança 
de 99% para a proporção de todos os nascimentos que 
resultaram em crianças com baixo peso. 

23. O artigo “An Evaluation of Football Helmets Under I 
Impact Conditions” (Amer. J. Sports Medicine , 1 984, p. 
233-237) relata que, quando cada capacete de futebol 
americano, em uma amostra aleatória de 37 capacetes 
do tipo suspensão, foi submetida a certo teste de im- 
pacto, 24 mostraram estar com defeito. Seja p a pro- 
porção de todos os capacetes desse tipo que mostrariaM 
algum dano quando testados da maneira prescrita. 

a. Calcule o IC de 99% para p. 

b. Que tamanho de amostra seria necessário para a ara- j 
plitude de um IC de 99% ser no máximo de 0,10 sem| 
considerar p ? 

24. Uma de 56 amostras de algodão de pesquisa resultou 
em uma porcentagem de alongamento médio da amos- j 
tra de 8,17 e desvio padrão amostrai de 1.42 (“Aí 
Apparent Relation Between the Spiral Angle <f > , the Per- 
cent Elongation Ej, and the Dimensions of the Cottoq 
Fiber”, Textile Research J., 1978, p. 407-410). Cali 
o IC de amostra grande de 95% para a porcentagem dei 
alongamento médio real p. Que suposições você está 
fazendo com relação à distribuição da porcenl 
de alongamento? 

25. Um deputado estadual deseja pesquisar os residentes dej 
seu distrito para ver que proporção do eleitorado está 
ciente de sua posição sobre o uso de fundos do Esl 
para pagar abortos. 

a. Que tamanho de amostra é necessário, se o IC de 
95% de p tiver amplitude de no máximo 0.10 
considerar pl 

b. Se o deputado tem forte razão para acreditar que 
pelo menos do eleitorado sabe de sua posição, q 
grande você recomendaria que o tamanho da 
tra fosse? 

26. O superintendente do distrito de uma grande escola. q 
fez um curso de probabilidade e estatística, acreáÉ 
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que o número de professores ausentes em um dia qual- 
quer possua distribuição de Poisson com parâmetro À. 
Use os dados a seguir sobre as ausências durante 50 dias 
para deduzir o IC de amostra grande para À. [Sugestão: 
a média e a variância de uma variável de Poisson são am- 
bos iguais a A. assim 


possui aproximadamente distribuição normal padroniza- 
da. Prossiga como na derivação do intervalo de /?, 
definindo a situação (com probabilidade 1 - a) e resol- 
vendo as desigualdades resultantes de A (veja a expli- 
cação abaixo de (7. 10)).] 


Número de 

ausentes 01 2 345 678910 

Freqüência 148 10 87 5321 1 

27. Reconsidere o IC (7.10) para p e enfoque um nível de 
confiança de 95%. Mostre que os limites de confiança 
estão de acordo com os do intervalo tradicional (7.1 1), 
uma vez que dois sucessos e duas falhas foram adi- 
cionados à amostra [isto é, (7.1 1) com base em x + 2 
S's em n + 4 tentativas]. ( Sugestão : 1,96 « 2. Nota: 
Agresti e Coull mostraram que esse ajuste do intervalo 
tradicional também possui nível de confiança real pró- 
ximo ao nível nominal.) 


7.3 


Intervalos Baseados em uma 
Distribuição Normal da População 


0 IC de apresentado na Seção 7.2 é válido, desde que n seja grande. O intervalo resultante é usado, qualquer 
que seja a natureza da distribuição da população. O TLC não poderá ser usado, entretanto, quando n for pequeno. 
Nesse caso, uma maneira de continuar é fazer uma suposição específica sobre a forma da distribuição da popu- 
lação e deduzir um IC feito sob medida a essa suposição. Por exemplo: poderíamos desenvolver um IC de jx 
quando a população for descrita por uma distribuição gama, outro intervalo para o caso de uma população de 
Weibull, e assim por diante. Os estatísticos realmente fizeram esse programa para um número de famílias de dis- 
tribuição diferentes. Em virtude de a distribuição normal ser apropriada mais freqüentemente como um modelo 
da população que qualquer outro tipo de distribuição, enfocaremos aqui um IC para essa situação. 


SUPOSIÇÃO 


A população de interesse é normal, de modo que X,, ..., X„ constitui uma amostra aleatória 
de uma distribuição normal com /tetr desconhecidos. 


0 resultado-chave subordinado ao intervalo na Seção 7.2 foi que. para n grande, a va Z = (X - /u,)/(S/Vn) 
possui aproximadamente uma distribuição normal padronizada. Quando n é pequeno, S provavelmente não está 
mais próximo de cr, de modo que a variabilidade na distribuição de Z surge da aleatoriedade no numerador e no 
denominador. Isso implica que a distribuição de probabilidade de (X - /i)/(S/Vn) será mais dispersa que a dis- 
tribuição normal padronizada. O resultado no qual as inferências se baseiam introduz uma nova família de 
distribuições de probabilidade chamada família de distribuições t. 


TEOREMA 


Quando X é a média amostrai aleatória de tamanho n de uma distribuição normal com mé- 
dia ix, a va 


T = 



(7.13) 


possui uma distribuição de probabilidade chamada distribuição t com n — I graus de 
liberdade (gl). 
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Propriedades das Distribuições t 


Antes de aplicar este teorema, uma discussão das propriedades das distribuições t é solicitada. Embora a variável 
de interesse ainda seja ( X — /a)/(S/V«), nós a representamos agora por T, para enfatizar que ela não possui uma 
distribuição normal padronizada quando n é pequeno. Lembre-se de que uma distribuição normal é determinada 
por dois parâmetros, a média jae o desvio padrão cr. A distribuição t é determinada apenas por um parâmetro, 


chamado número de graus de liberdade da distribuição, abreviado por gl. Nós o representamos pela letra grega 
v. Valores possíveis de v são os inteiros positivos 1, 2, 3, ... Cada valor diferente de v corresponde a uma dis- 
tribuição t diferente. 

Para qualquer valor fixo do parâmetro v, a função densidade que especifica a curva t associada possui uma 
aparência ainda mais complicada que a função densidade normal. Felizmente, precisamos nos preocupar so- 
mente com algumas das características mais importantes dessas curvas. 


O número de gl de T em (7.13) é n — 1, pois, embora S se baseie nos n desvios X! — X, .... X n -X. 
X(X, — X) = 0 implica que somente n — 1 deles são “livremente determinados”. A quantidade de gl de uma va- 


Uma vez que queremos usar T para obter um IC da mesma maneira que Z foi usado anteriormente, é 
necessário estabelecer notação análoga a z a para a distribuição t. 


obter to, 05,15’ V3 P 313 3 coluna a = 0,05, procure a linha = 15 e leia f 005 l5 = 1,753. De maneira semelh 
í 0 ,05, 22 = 1*717 (coluna 0,05, linha v = 22) e f 0 01 12 = 2,508. 


Propriedades das distribuições t 

Seja t v a curva da função densidade dos gl de v. 

1. Cada curva t v possui formato de sino e está centrada em 0. 

2. Toda curva t v é mais dispersa que a curva normal padronizada (z). 

3. À medida que v aumenta, a dispersão da curva t„ correspondente diminui. 

4 . À medida que v — > oc a seqüência das curvas t v se aproxima da curva normal 


padronizada (de modo que a curva z é chamada geralmente de curva t com gl = °o). 


A Figura 7.6 ilustra algumas dessas propriedades dos valores selecionados de v. 


i_urva z 

i \ Curva /25 

/ ; ^ Curva t 5 

r/ ' 

f i \ 

/ i \ 

yf • \v 


Curva z 




0 

Figura 7.6 Curvas t v e z 


riável té a quantidade de desvios determinados livremente onde o desvio padrão estimado no denominador de 
T se baseia. 


Notações 

Seja t a v = o número no eixo de medição para o qual a área sob a curva t com gl v à 
direita de t a v é a; t a v é chamado valor crítico t. 


Essa notação é ilustrada na Figura 7.7. A Tabela A.5 do Apêndice fornece t a v para valores selecionados de ael 
v. Essa tabela também aparece na contracapa. As colunas da tabela correspondem a valores diferentes de a. 
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/ Curva t v 



Área sombreada = a 


Figura 7.7 Definição ilustrada de t Q P 


Os valores de t a v exibem comportamento regular, à medida que mudamos de linha ou coluna. Para v fixo, 
í a „ aumenta à medida que a diminui, uma vez que temos de mover à direita de zero para encontrar a área a na 


tabela í), o valor de t ar diminui, porque um valor maior de v implica uma distribuição t com dispersão menor, 
de modo que não é necessário se afastar muito de zero para encontrar a área a da cauda. Além disso, t a v diminui 
mais lentamente à medida que v aumenta. Consequentemente, os valores da tabela são mostrados em incremen- 
tos de 2 entre 30 e 40 gl e depois pulam para v = 50, 60, 120 e finalmente *>. Em virtude de t ^ ser a curva nor- 
mal padronizada, os valores z a familiares aparecem na última linha da tabela. A regra prática sugerida 
anteriormente para uso do IC de amostra grande (se n > 40) surge da igualdade aproximada das distribuições t 
e normal padronizada de v > 40. 

0 intervalo de Confiança t de uma Amostra 

A variável padronizada T possui distribuição t com n — 1 gl e a área sob a curva de densidade t correspondente 
entre -t^ 2 „_| e ta /2 n -\ é 1 — a (a área a/2 está em cada cauda), assim 


A expressão (7.14) difere-se das expressões nas seções anteriores porque T e t a/2n _ | são usados no lugar de Z 
e z a /2 mas pode ser manipulada da mesma forma para obter um intervalo de confiança de fi. 


Como parte de um projeto maior para estudar o comportamento de painéis de revestimento tencionado, compo- 
nente estrutural que está sendo usado extensivamente nos Estados Unidos, o artigo “Time-Dependent Bending 
Properties of Lumber” (7. ofTesting and Eval., 1996, p. 187-193) relatou diversas propriedades mecânicas de es- 


cauda. Para a fixo à medida que v é aumentado (isto é, quando procuramos em qualquer coluna específica da 


t aíl,n— I <T < — l ~ a 


( 7 . 14 ) 


PROPOSIÇÃO Sejam reia média e o desvio padrão amostrais calculados a partir dos resultados de uma 


amostra aleatória de uma população normal com média /a. Então, o intervalo de confian- 
ça de 100(1 - a)% para n é 



( 7 . 15 ) 


ou, mais compactamente, x ± í a/2n _ 1 • sA/n. 


O limite de confiança superior de /i, é 



e substituir + por - nessa última expressão fornece o limite de confiança inferior de fi, 
com nível de confiança de 100(1 — a)%. 


Exemplo 7.11 


pécimes de madeira serrada de pinho da Escócia. Considere as seguintes observações sobre o módulo de elasti- 
cidade (MPa) obtido 1 minuto depois da aplicação de carga em uma determinada configuração: 
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10.490 16.620 17.300 15.480 12.970 17.260 13.400 13.900 

13.630 13.260 14.370 11.700 15.470 17.840 14.070 14.760 

A Figura 7.8 mostra um gráfico de probabilidade normal obtido do MINITAB. O padrão reto no gráfico fornece 
forte apoio para assumir que a distribuição da população do módulo de elasticidade é pelo menos apro- 
ximadamente normal. 

O cálculo manual da média amostrai e do desvio padrão é simplificado subtraindo 10.000 de cada obser- 
vação: y,- = Xj — 10.000. Verifica-se com facilidade que Xy, = 72.520 e Xy? = 392.083.800. pelo que y = 
4532,5 e s v = 2055,67. Dessa forma, x = 14.532,5 e s x = 2055,67 (adicionar ou subtrair a mesma constante de 
cada observação não afeta a variabilidade). O tamanho da amostra é 16, de modo que o intervalo de confiança 
do módulo de elasticidade médio da população se baseia em 15 gl. Um nível de confiança de 95% de um inter- 
valo bicaudal exige o valor crítico t de 2,131. O intervalo resultante é 

I ± <0.025.15 • = 14.532.5 ± (2,131) 

= 14.532,5 ± 1095,2 = (13.437,3, 15.627,7) 

O intervalo é bastante amplo devido tanto ao tamanho pequeno da amostra, como ao valor grande da variabili- 
dade. O limite de confiança inferior de 95% é obtido usando-se - e 1 ,753 em vez de ± e 2, 1 3 1 , respectivamente, i 



Marcas 

Figura 7.8 Gráfico de probabilidade normal dos dados do módulo de elasticidade ■ 

Infelizmente, não é fácil selecionar n para controlar a amplitude do intervalo t, porque a amplitude envolve 
o s desconhecido (antes de os dados serem coletados) e porque n entra não somente por meio de 1/Vn como 
também por meio de t arln _ [ . Como resultado, n apropriado pode ser obtido somente por tentativa e erro. 

No Capítulo 15, discutiremos um 1C de amostra pequena para p. que seja válido somente se a distribuição da 
população for simétrica, uma suposição mais fraca que a normalidade. Entretanto, quando a distribuição da popu- j 
lação é normal, o intervalo t tende a ser menor do que qualquer outro intervalo com o mesmo nível de confiança,! 

Um Intervalo de Previsão para um Único Valor Futuro j 

Em muitas aplicações, o investigador deseja prever um único valor de uma variável a ser observado futuramenle. 
em vez de estimar o valor médio dessa variável. 

Exemplo 7.12 I 

Considere a seguinte amostra do teor de gordura (em porcentagem) de n = 10 cachorros-quentes selecionado» 
aleatoriamente (“Sensory and Mechanical Assessment of the Quality of Frankfurters”. J. Texture Studies, 1990,1 

p. 395-409): 

25,2 21,3 22,8 17,0 29,8 21.0 25.5 16.0 20,9 19,5 
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Assumindo que foram selecionados, de uma distribuição normal da população, um IC de 95% (estimativa do 
intervalo de) do teor de gordura médio da população é 

* ± '0,025.9 • ^ = 21,90 ± 2,262 • ^ = 21,90 ± 2,96 


= (18,94, 24,86) 

Suponha, entretanto, que você comerá um único cachorro-quente desse tipo e queira uma previsão do teor de 
gordura resultante. A previsão pontual , análoga à estimativa pontual , é apenas x = 21,90. Essa previsão infeliz- 
mente não fornece informações sobre confiabilidade ou precisão. ■ 

A configuração geral é a seguinte: teremos disponível a amostra aleatória X ]% X 2 , ..., X n de uma distribuição 
normal da população, e queremos premer o valor de X n + 1 de uma única observação futura. Um previsor pontual 
é X, e o erro de previsão resultante é X — X n+ 1 . O valor esperado do erro de previsão é 

E{X - X„ +l ) = E(X ) - E(X n+l ) = /& — p, = 0 

Uma vez que X n+ 1 é independente de X), ..., X n , ele é independente de X, de modo que a variância do erro de 
previsão é 

■ V(x - X n+l ) = V(X) + V(X n+l ) = ^ + O- 2 = O-^I + 1 ) 

Oerro de previsão é uma combinação linear de vas independentes normalmente distribuídas, de modo que ele 
próprio seja normalmente distribuído. Dessa forma, 

z= (X-X n+ ,)-Q = x-x„ + , 

1 H + ») H' + i) 

possui uma distribuição normal padronizada. É possível mostrar que substituindo cr pelo desvio-padrão da 
amostra S (de X), ..., X n ). resulta em 


T = 


5 / 1 + - 

n 


~ distribuição t com n — 1 gl 


lipular a variável T, como T = (X - p. )/(5/Vn) foi 
tinte resultado. 


manipulado no desenvolvimento de um IC, fornece o 



O intervalo de previsão (IP) de uma única observação a ser selecionada de uma dis- 
tribuição normal da população é 

J± 'o/2a.-t ’ s J l (7.16) 
O nível de previsão é 1 00( 1 — a)%. 


A interpretação de um nível de previsão de 95% é semelhante à de um nível de confiança de 95%; se o inter- 
valo (7.16) for calculado para amostra após amostra, os 95% de longo prazo desses intervalos incluirão os va- 
lores futuros correspondentes de X. 
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Exemplo 7.13 (continuação do Exemplo 7.12) 

Com n = 10, x = 21,90, s = 4,134 e /q.025, 9 = 2,262, um IP de 95% do teor de gordura de um único cachorro- 
quente é 


O erro de previsão é X — X, t+l , diferença entre duas variáveis aleatórias, enquanto o erro de estimativa é 
X — /a, diferença entre uma variável aleatória e um valor fixo (mas desconhecido). O IP é mais amplo que o IC, 
pois há mais variabilidade no erro de previsão (devido a que no erro de estimativa. De fato, à medida que 
n fica arbitrariamente maior, o IC diminui para o único valor /x e o IP se aproxima de /x ± z a/2 • cr. Há incerteza 
sobre um único valor de X$ mesmo quando não há necessidade de fazer estimativa. 

Intervalos de Tolerância 

Considere uma população de determinado tipo de automóveis e suponha que, sob condições especificadas, oj 
consumo de combustível (milhas/galão) possui distribuição normal com fi = 30 e a = 2. Então, uma vez que o 
intervalo de -1,645 a 1,645 contendo 90% da área sob a curva z, 90% de todos esses automóveis terão valores 
de consumo de combustível entre /jl — l,645cr = 26,71 e fi + l,645cr = 33,29. Mas o que acontece se os 
valores de /x e cr não são conhecidos? Podemos tomar uma amostra de tamanho n, determinar os consumos de 
combustível, x e $, e formar o intervalo cujo limite inferior seja x — 1,645 s e o limite superior seja x + l,645s. 
Entretanto, devido à variabilidade da amostragem nas estimativas de p e cr, existe uma boa chance de o inter- 
valo resultante incluir menos de 90% dos valores da população. Intuitivamente, para ter uma chance a priori de 
95%, de o intervalo resultante incluir pelo menos 90% dos valores da população, quando x e s são usados nolu- ] 
gar de /x e cr, devemos também substituir 1,645 por algum número maior. Por exemplo: qu 
n — 20, o valor 2,3 10 é tal que podemos ter 95% de confiança de que o intervalo x ± 2,31 0s incluirá pelo me 
90% dos valores de consumo de combustível na população. 


para um nível de confiança de 99% (esses valores são maiores que os valores de 95% corres- 
pondentes). Substituir ± por 4- fornece um limite de tolerância superior, e usar - no lugar de 
± resulta em um limite de tolerância inferior. Os valores críticos para obter esses limites 
monocaudais também aparecem na Tabela A. 6 do Apêndice. 


Exemplo 7.14 

Vamos voltar aos dados do módulo de elasticidade discutidos no Exemplo 7.1 1, onde n = 16, x = 14.532,5,5 
2055,67 e um gráfico de probabilidade normal dos dados indicou que a normalidade da população era bas 
plausível. Para um nível de confiança de 95%, o intervalo de tolerância bicaudal para incluir pelo menos 9 


21,90 ± (2,262)(4,134) l + -L = 21,90 ± 9,81 


10 


= (12,09,31,71) 


Esse intervalo é bastante amplo, indicando incerteza substancial sobre o teor de gordura 
tude do IP é mais que três vezes a do IC. 



Seja k um número entre 0 e 100. Um intervalo de tolerância para incluir pelo menos k% dos 
valores de uma distribuição normal da população com nível de confiança de 95% possui 
a forma 


x ± (valor crítico de tolerância) • s 


Os valores críticos de tolerância para k = 90, 95 e 99 em combinação com vários tamanhos 
de amostra são dados na Tabela A. 6 do Apêndice. Essa tabela também inclui valores críticos 
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dos valores do módulo de elasticidade de espécimes de madeira serrada na população que serviu como amostra 
utiliza o valor crítico de tolerância de 2,903. O intervalo resultante é 

14.532,5 ± (2,903)(2055,67) = 14.532,5 ± 5967,6 = (8.564,9, 20.500,1) 

Podemos estar altamente confiantes de que pelo menos 95% de todos os espécimes de madeira serrada têm va- 
lores de módulo de elasticidade entre 8.564,9 e 20.500,1. 

O IC de 95% de fi era (13.437,3, 15.627,7) e o intervalo de previsão de 95% do módulo de elasticidade de 
um único espécime de madeira serrada é (10.017,0, 19.048,0). O intervalo de previsão e o intervalo de tolerân- 
cia são substancialmente mais amplos que o intervalo de confiança. ■ 

Intervalos Baseados em Distribuições Não-normais de População 

0 1C de t de uma amostra para /x é robusto, para desvios pequenos ou mesmo moderados da hipótese de nor- 
malidade, a menos que n seja muito pequeno. Por isso, queremos dizer que, se um valor crítico de confiança de 
95%, por exemplo, for usado para calcular o intervalo, o nível de confiança real estará razoavelmente próximo 
do nível de 95% nominal. Entretanto, se n for pequeno e a distribuição da população for altamente não-normal, 
então o nível de confiança real pode ser consideravelmente diferente do que você pensa que está utilizando 
quando obtém um valor crítico específico da tabela de *. Certamente, seria frustrante acreditar que seu nível de 
confiança é cerca de 95% quando, na verdade, era realmente mais provável ser de 88% ! A técnica de bootstrap , 
introduzida na Seção 7.1, tem muito sucesso na estimativa de parâmetros em uma grande variedade de situações 
não-normais. 

Em comparação com o intervalo de confiança, a validade dos intervalos de tolerância e previsão descritos 
nesta seção está ligada mais proximamente à suposição de normalidade. Esses últimos intervalos não devem ser 
utilizados na ausência de evidência constrangedora à normalidade. A excelente referência Statistical Intervals , 
citada na bibliografia no final deste capítulo, discute procedimentos alternativos desse tipo para várias ou- 
tras situações. 


Exercícios I Seção 7.3 (28-41) 

28. Determine os valores das seguintes quantidades: 

*• ^0, 1,15 b- *0.05, 15 c - *0,05,25 *0,05,40 e - *0,005,40 

29. Determine o valor crítico t que incluirá a área da curva 
t desejada em cada um dos casos a seguir: 

a. Área central = 0,95, gl = 10 

b. Área central = 0.95, gl = 20 

c. Área central = 0,99, gl = 20 
<L Área central = 0,99, gl = 50 

e. Área da cauda superior = 0,01, gl = 25 

f. Área da cauda inferior = 0,025, gl = 5 

30. Determine o valor crítico t de um intervalo de confiança 
bicaudal em cada uma das situações a seguir: 

a. Nível de confiança = 95%, gl = 10 

b. Nível de confiança = 95%, gl = 15 

c. Nível de confiança = 99%, gl = 15 

d. Nível de confiança = 99%, n = 5 

e. Nível de confiança = 98%. gl = 24 

f. Nível de confiança = 99%, n = 38 

31. Determine o valor critico / de um limite de confiança in- 
ferior ou superior para cada uma das situações descritas 
no Exercício 30. 

32. Uma amostra aleatória de n = 8 espécimes de teste de 
certo tipo de fibra de vidro E produziu uma força do 


rendimento de corte interfacial média amostrai de 30,2 
e desvio padrão da amostra de 3,1 (“On Interfacial Fai- 
lure in Notched Unidirectional Glass/Epoxy Compo- 
sites”, J. of Composite Materials , 1985, p. 276-286). 
Assuma que a força do rendimento de corte interfacial 
é normalmente distribuída, calcule o IC de 95% para 
a força média real (como fizeram os autores do arti- 
go citado). 

33. O artigo “Measuring and Understanding the Aging of 
Kraft Insulating Paper in Power Transformers” (IEEE 
Electrical Insul. Mag ., 1996, p. 28-34) continha as 
seguintes observações sobre o grau de polimerização 
dos espécimes de papel para os quais a viscosidade 
vezes a concentração caíram em certo intervalo in- 
termediário: 


418 

421 

421 

422 

425 

427 

431 

434 

437 

439 

446 

447 

448 

453 

454 

463 

465 






a. Construa um boxplot dos dados e comente quaisquer 
características interessantes. 

b. É plausível que as observações da amostra fornecidas 
tenham sido selecionadas de uma distribuição normal? 
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c. Calcule o intervalo de confiança de 95% bicaudal 
para o grau médio real de polimerização (como fize- 
ram os autores do artigo). O intervalo sugere que 
440 seja um valor plausível para o grau médio real 
de polimerização? E quanto a 450? 

34 . Uma amostra de 14 espécimes de juntas de um tipo es- 
pecífico forneceu o limite de carga proporcional médio 
da amostra de 8,48 MPa e desvio padrão da amostra de 
0,79 MPa (“Characterization of Bearing Strength Fac- 
tors in Pegged Timber Connections”, J. of Structural 
Engr, 1997, p. 326-332). 

a. Calcule e interprete o limite de confiança inferior de 
95% para o limite de carga proporcional médio real 
de todas as juntas. Que hipótese, se houver, você faria 
sobre a distribuição do limite de carga proporcional? 

b. Calcule e interprete o limite de previsão inferior de 
95% para o limite de carga proporcional de uma 
única junta desse tipo. 

35 . O Exercício 46 no Capítulo 1 introduziu as seguintes 
observações da amostra sobre viscosidade estabilizada 
de espécimes de asfalto: 2781, 2900, 3013, 2856, 2888. 
Um gráfico de probabilidade normal suporta a hipótese 
de a viscosidade ser distribuída, pelo menos aproxi- 
madamente, de forma normal. 

a. Calcule a viscosidade média real, de forma que trans- 
mita informações sobre precisão e confiabilidade. 

b. Preveja a viscosidade de um único espécime de as- 
falto, de modo que transmita informações sobre pre- 
cisão e confiabilidade. Como a previsão se compara 
com a estimativa calculada na parte (a)? 

36 . As n =26 observações sobre o tempo de fuga dado no 
Exercício 36 do Capítulo 1 fornecem a média e o desvio 
padrão da amostra de 370,69 e 24,36, respectivamente. 

a. Calcule o limite de confiança superior para o tempo 
médio de fuga da população, usando um nível de 
confiança de 95%. 

b. Calcule o limite de previsão superior para o tempo 
de fuga de um único trabalhador adicional, usando 
um nível de previsão de 95%. Como esse limite se 
compara ao limite de confiança da parte (a)? 

c. Suponha que dois trabalhadores adicionais sejam 
escolhidos para participar do exercício simulado de 
fuga. Represente seus tempos de fuga por X 21 e 
X 28 . e por X novo a média desses dois valores. Mo- 
difique a fórmula de um IP para um único valor de 
x, a fim de obter o IP de X novo e calcule o interva- 
lo bicaudal de 95%, com base nos dados de fuga 
fornecidos. 

37 . Um estudo da habilidade de as pessoas andarem em 
linha reta (“Can We Really Walk Straight?” Arner J. of 
Physical Anthro ., 1992, p. 19-27) relatou os dados que 
seguem sobre a cadência (passos por segundo) de uma 
amostra de n = 20 homens saudáveis, aleatoria- 
mente selecionados. 


0,95 0,85 0,92 0.95 0,93 0,86 1,00 0,92 0,85 0.81 
0,78 0,93 0,93 1,05 0,93 1,06 1,06 0,96 0,81 0.96 

Um gráfico de probabilidade normal fornece suporte 
substancial à hipótese de que a distribuição da popu- 
lação da cadência seja aproximadamente normal. Segue 
um resumo descritivo dos dados do MINITAB: 


Variável N Média Mediana Média Ap Desv Padrào Média SE 
cadência 200,9255 0,9300 0,9261 0,0809 0,0181 j 


Variável Min Max Q1 Q3 

cadência 0,7800 1,0600 0,8525 0,9600 

a. Calcule e interprete o intervalo de confiança de 95% 
para a cadência média da população. 

b. Calcule e interprete o intervalo de previsão de 95% 
para a cadência de uma única pessoa selecionada 
aleatoriamente dessa população. 

c. Calcule o intervalo que inclua pelo menos 99% das 
cadências da distribuição da população, usando um 
nível de confiança de 95%. 

38. Uma amostra de 25 peças de laminado usado na fabri- 
cação de placas de circuito foi selecionada, e a quanti- 
dade de deformação (in.) sob condições específicas foi 
determinada para cada peça, resultando em uma defor- 
mação média amostrai de 0,0635 e um desvio padrão 
de 0,0065. 

a. Calcule uma previsão para a quantidade de defor- 
mação de uma única peça de laminado, de modo que 
forneça informações sobre precisão e confiabilidade:; 

b. Calcule o intervalo no qual você possa ter alto grau 
de confiança de que pelo menos 95% de todas 
as peças de laminado resultem em quantidades de 
deformação que estejam entre os dois limites do 
intervalo. 
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grande, nenhuma suposição sobre a distribuição da po- 
pulação é necessária para a validade do IC. 

a. Qualquer suposição sobre a distribuição da resistên- 
cia à tensão é necessária, antes de calcular um limite 
de previsão inferior para a resistência à tensão do 
próximo espécime selecionado usando o método 
descrito nesta seção? Explique. 

b. Use um programa estatístico para investigar a plau- 
sibilidade de uma distribuição normal da população. 

c. Calcule o limite de previsão inferior com um nível 
de previsão de 95% para a resistência extrema à ten- 
são do próximo espécime selecionado. 


41. Uma tabulação mais extensiva dos valores críticos t que 
a mostrada neste livro indica que, para a distribuição t 
com gl 20, as áreas à direita dos valores 0,687, 0,860 e 
1,064 são 0,25. 0,20 e 0,15, respectivamente. Qual é o 
nível de confiança de cada um dos três intervalos de 
confiança a seguir para a média /jl de uma distribuição 
normal da população? Qual dos três intervalos você re- 
comendaria para ser usado e por quê? 

a. (x - 0,687sA/2Í, x + l,725s/V21) 

b. (x - 0,860.í/V2Í, x + 1 ,325s/V2l) 

c. (x - 1 ,064í/ V 2 T, x + 1 ,064.ç/V21) 


7.4 


Intervalos de Confiança para Variância e 
Desvio Padrão de uma População Normal 


Embora as inferências relacionadas à variância de uma população a 2 ou ao desvio padrão a sejam geralmente 
de menor interesse que as referentes à média ou proporção, há ocasiões em que tais procedimentos são 
necessários. No caso de uma distribuição normal da população, as inferências são feitas com base no seguinte 
resultado relacionado à variância da amostra S 2 . 


TEOREMA 


Seja Xj, X 2 , X n a amostra aleatória de uma distribuição normal com parâmetros 
ix e a 2 . Então, a va 

jn ~ 1 )Sj _ T.(X - X)- 


possui distribuição de probabilidade qui-quadrada (* 2 ) com n - 1 gl. 


Conforme discutido nas seções 4.4 e 7.1, a distribuição qui-quadrada é uma distribuição de probabilidade 
contínua com um único parâmetro v, chamado número de graus de liberdade, com valores possíveis 1, 2, 
3, ... Os gráficos de diversas funções-distribuição de probabilidade de \ 2 (fdps) são ilustrados na Figura 7.9. 
Cada fdp/(jc; v) é positiva somente para v > 0, e cada uma possui inclinação positiva (cauda superior longa), 
embora a distribuição se mova à direita e se torne mais simétrica à medida que v aumenta. Para especificar os 
procedimentos inferenciais que utilizam a distribuição qui-quadrada, precisamos de notação análoga à de um 
valor crítico t de t a v . 



Figura 7.9 Gráficos das funções-densidade qui-quadrada 
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Notação 

Seja x 2 a v chamado valor crítico qui-quadrado, o número no eixo da medição, de 
modo que a da área sob a curva qui-quadrada com gl v esteja à direita de x 2 a 

J 

Em virtude de a distribuição t ser simétrica, foi necessário tabular somente os valores críticos da cauda 
superior (t a „ para valores pequenos de a). A distribuição qui-quadrada não é simétrica; de modo que, a Tabela 
A.7 do Apêndice contém valores de x^ tanto para a próximo de 0 e de 1, conforme ilustrado na Figura 7. 10(b). 
Por exemplo: *0025 14 = 26,1 19 4 ^ 95 20 (o 5°percentil) = 10,851. 


Cada área 
sombreada = 0,01 



Figura 7.10 Notação ilustrada de xá „ 

A va (n — 1 )S 2 /a 2 satisfaz as duas propriedades nas quais o método geral para obter IC se baseia: é uma 
função do parâmetro de interesse cr 2 , ainda que sua distribuição de probabilidade (qui-quadrada) não dependa 1 
desse parâmetro. A área sob uma curva qui-quadrada com gl v à direita de X' a p v é <*/ 2, como a área à esquerda I 
de x\-ai 2 y Dessa forma, a área incluída entre esses dois valores críticos é 1 - a. Como conseqüência disso e 
do teorema que acabamos de enunciar, 

~J )5 ' < = * - « 

As desigualdades de (7.17) são equivalentes a 

(n — 1)S 2 , [n - 1)5 2 

: < cr < 2 

X a/2,n~ 1 X\ —a/2,n— 1 


Substituindo o valor calculado s 2 nos limites fornece o IC para cr e extraindo as raízes quadradas obtém-se o 
intervalo de cr. 


O intervalo de confiança de 100(1 - a)% para a variância «r de uma população 

normal possui limite inferior 


e limite superior 


(n - DsVxln.n-l 
{n - 1 )s 1 lx\- a n.n-\ 


O intervalo de confiança para cr possui limites superior e inferior que são as raízes 
quadradas dos limites correspondentes no intervalo para cr. 
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Exemplo 7.15 

Os dados que seguem sobre a voltagem de quebra de circuitos carregados eletricamente foram obtidos de um 
gráfico de probabilidade normal que apareceu no artigo “Damage of Flexible Printed Wiring Boards Associated 
with Lightning-Induced Voltage Surges” ( IEEE Transactions on Components, Hybrids, and Manuf. Tech., 1985, 
p. 214-220). A disposição em reta do gráfico forneceu forte apoio à suposição de que a voltagem de quebra é 
aproximadamente distribuída de forma normal. 

1470 1510 1690 1740 1900 2000 2030 2100 2190 

2200 2290 2380 2390 2480 2500 2580 2700 

Seja <r a variância da distribuição da voltagem de quebra. O valor calculado da variância da amostra éi 3 = 
137.324,3, a estimativa pontual de <r 2 . Com gl = n — 1 = 16, o IC de 95% requer que *^ 975 , 6 = 6,908 e 
*0.025,16 = 28,845. O intervalo é 

( 16 < I37:IM . 3 > , l«K'37.33*.3) \ _ ,76 ,72,3, 3I8 .064. 4 > 

V 28.845 6.908 ) 

Extraindo a raiz quadrada de cada ponto final produz (276,0, 564,0), IC de 95% para cr. Esses intervalos são bas- 
tante amplos, refletindo a variabilidade substancial na voltagem de quebra em combinação com o tamanho pe- 
queno de uma amostra. ■ 


Os ICs de a 2 e o*, quando a distribuição da população não é normal, podem ser difíceis de se obter, mesmo 
quando o tamanho da amostra é grande. Para esses casos, consulte um estatístico de renome. 


Exercícios I Seção 7.4 (42-46) 

41 Determine os valores das seguintes quantidades: 

*• *0,1.15 b. *0,1.25 
C *0.01.25 *0,005.25 

*0.99.25 *0.995.25 

43. Determine o seguinte: 

a. 0 95 ü percentil da distribuição qui-quadrada com 
v - 10 

b. 0 5 Ü percentil da distribuição qui-quadrada com 

i/= 10 

c. P( 10,98 ^ x 2 — 36,78), onde * 2 é uma va qui-qua- 
drada com v = 22 

d. P(\ l <14,611 ou x 2 > 37,652), onde * 2 é uma va 
qui-quadrada com v = 25 

44. A quantidade de expansão lateral (mils) foi deter- 
minada para uma amostra de n =9 soldas de arco de 
gás metálico acionado por pulsos usados em tanques de 
carga de navio LNG. O desvio padrão da amostra re- 
sultante foi s = 2,81 mils. Assumindo a normalidade, 
encontre o IC de 95% para a 2 e para cr. 

45. As seguintes observações foram feitas sobre a dureza de 
fratura de uma placa de base de 18% de níquel em aço 


inoxidável [“Fracture Testing of Weldments”, ASTAi 
Special Publ n c 381, 1965, p. 328-356 (in ksi Vin., 
dado em ordem crescente)]: 

69,5 71,9 72,6 73,1 73,3 73,5 75,5 75,7 

75,8 76,1 76,2 76,2 77,0 77,9 78,1 79,6 

79,7 79,9 80,1 82,2 83,7 93,7 

Calcule o IC de 99% para o desvio padrão da dis- 
tribuição de dureza de fratura. Esse intervalo é válido 
qualquer que seja a natureza da distribuição? Explique. 

46. Os resultados de um teste de turvação de Wagner rea- 
lizado em 15 amostras de areia de teste-padrão de 
Otawa foram (em microampères): 

26,7 25,8 24,0 24,9 26,4 25,9 24,4 21,7 
24,1 25,9 27,3 26,9 27,3 24,8 23,6 

a. É plausível que essa amostra tenha sido selecionada 
de uma distribuição normal da população? 

b. Calcule o limite de confiança superior com nível de 
confiança de 95% para o desvio padrão da população 
de turvação. 
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I Exercícios Suplementares (47-62) 

47. O Exemplo 1.11 introduziu as observações que 
seguem sobre resistência de contato. 


11,5 

12,1 

9,9 

9,3 

7.8 

6,2 

6.6 

7.0 

13,4 

17,1 

9,3 

5,6 

5,7 

5,4 

5,2 

5,1 

4,9 

10.7 

15,2 

8,5 

4,2 

4,0 

3,9 

3,8 

3,6 

3,4 

20,6 

25,5 

13,8 

12,6 

13,1 

8,9 

8,2 

10,7 

14,2 

7,6 

5,2 

5,5 

5,1 

5,0 

5,2 

4.8 

4.1 

3,8 

3,7 

3,6 

3,6 

3,6 


a. Estime a resistência de contato média real, de modo 
que transmita informações sobre precisão e confia- 
bilidade. ( Sugestão : X* f = 387,8 e X*/ = 4247,08.) 

b. Calcule o IC de 95% para a proporção de todas as 
junções cujos valores de resistência excederiam 10. 

48. Um triatlo que consiste em nadar, andar de bicicleta e 
correr é um dos eventos de esporte amador mais árduos. 
O artigo “Cardiovascular and Thermal Response of 
Triathlon Performance” ( Medicine and Science in 
Sports and Exercise, 1988, p. 385-389) relata um es- 
tudo de pesquisa que envolve nove triatletas do sexo 
masculino. O índice cardíaco máximo (batimentos/min) 
foi registrado durante a realização de cada um dos 
três eventos. Para a natação, a média e o desvio padrão 
amostrais foram 188,0 e 7,2, respectivamente. Assu- 
mindo que a distribuição do índice cardíaco seja 
(aproximadamente) normal, construa um IC de 98% 
para o índice cardíaco médio real dos triatletas durante 
a natação. 

49. Para cada um dos 18 centros preservados de reser- 
vatórios de carbonato de óleo, a quantidade de satu- 
ração de gás residual após a injeção de um solvente foi 
medida na saída do fluxo de água. As observações, em 
porcentagem de volume de poros, foram 

23,5 31,5 34,0 46,7 45,6 32,5 

41.4 37,2 42,5 46,9 51,5 36,4 

44.5 35,7 33,5 39,3 22,0 51,2 

(Consulte “Relative Permeability Studies of Gas-Water 
Flow Following Solvent Injection in Carbonate Rocks,” 
Soc. Petroleum Engine e rs /, 1976, p. 23-30.) 

a. Construa um boxplot desses dados e faça comen- 
tários sobre quaisquer características interessantes. 

b. É plausível que a amostra fosse selecionada de uma 
distribuição normal da população? 

c. Calcule o IC de 98% para a quantidade média real de 
saturação de gás residual. 

50. Um artigo de um periódico relata que uma amostra de 
tamanho 5 foi usada como base para calcular o IC 
de 95% para a freqüência natural média real (Hz) de vi- 
gas laminadas de determinado tipo. O intervalo resul- 
tante foi (229,764, 233,504). Você decide que um nível 


de confiança de 99% é mais apropriado que o nível de 
95% utilizado. Quais são os limites do intervalo de 
99% ? ( Sugestão : use o centro do intervalo e sua ampli- 
tude para determinar x e s.) 

51. O gerente financeiro de uma grande rede de lojas de 
departamentos selecionou uma amostra aleatória 
de 200 de seus clientes com cartão de crédito e desco- 
briu que 136 pagaram juros no ano anterior devido a 
saldo não-pago. 

a. Calcule o IC de 90% para a proporção real dos 
clientes com cartão de crédito que pagaram juros no 
ano anterior. 

b. Se a amplitude desejada do intervalo de 90% for 
0,05, que tamanho de amostra é necessário para 
garantir isso? 

c. O limite superior do intervalo na parte (a) especifica 
um limite de confiança superior de 90% para a pro- 
porção que está sendo estimada? Explique. 

52. O tempo de reação a um estímulo compreende o inter- 
valo de tempo entre o início e o fim desse estímulo, 
sinalizado pelo primeiro movimento visível. O artigo 
“Relationship of Reaction Time and Movement Time in 
a Gross Motor Skiir ( Perceptual and Motor Skills, 
1973, p. 453-454) relata que o TR médio da amostra 
de 16 nadadores experientes a um tiro inicial foi de 0,214 
s. e o desvio padrão da amostra foi de 0,036 s. 

a. Fazendo quaisquer suposições necessárias, encontre 
o IC de 90% do TR médio real de todos os nada- 
dores experientes. 

b. Calcule o limite de confiança superior de 90% para i 
o desvio padrão da distribuição do tempo de reação. 

c. Preveja o TR para outro indivíduo, de forma que | 
transmita informações sobre precisão e confiabilidade. 

53. A infestação de pulgão em árvores frutíferas pode ser con- 1 
trolada pela pulverização de pesticida ou inundação de 
joaninhas. Em uma área específica, quatro pomares de di- 
ferentes árvores frutíferas são selecionados para expe- I 
riência. Os três primeiros pomares são pulverizados com I 
pesticidas 1, 2 e 3, respectivamente, e o quarto é tratado I 
com joaninhas, produzindo os seguintes resultados: 


n i = 

número x ( 

Tratamento de árvores (alqueires/árvore) s, 


1 

100 

10,5 

1,5 I 

2 

90 

10,0 

1,3 1 

3 

100 

10,1 

1,8 I 

4 

120 

10,7 

1.6 1 


Seja /ij = o rendimento médio real (alqueires/árvoiejl 
depois de receber o i-ésimo tratamento. Então 

0 = y(Mi + M2 + M 3 ) - M4 
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meça a diferença nos rendimentos médios reais entre o 
tratamento com pesticidas e o tratamento com joani- 
nhas. Quando /ij, n 2 , e n A sào grandes, o estimador 
6 obtido pela substituição de cada /x, por X, é aproxi- 
madamente normal. Use esses dados para determinar o 
IC de 100( 1 - a)% de amostra grande para 0 e calcule 
o intervalo de 95% para os dados fornecidos. 

54. É importante que as máscaras usadas pelos bombeiros 
sejam capazes de resistir a altas temperaturas, pois 
esses profissionais trabalham com freqüência em tem- 
peraturas de 200-500°F. Em um teste de um tipo de 
máscara, 1 1 dos 55 equipamentos tiveram as lentes 
estouradas a 250°. Construa o IC de 90% para a pro- 
porção real de máscaras desse tipo, cujas lentes es- 
tourariam a 250°. 

55. Um fabricante de livros didáticos está interessado em 
estimar a resistência das capas produzidas por uma 
máquina de encadernação específica. A resistência pode 
ser medida registrando- se a força necessária para arran- 
car as páginas da encadernação. Se essa força for me- 
dida em libras, quantos livros devem ser testados para 
estimar a força média necessária para quebrar a en- 
cadernação dentro de 0, 1 1b com confiança de 95% ? As- 
suma que a seja 0,8. 

56. A exposição crônica à fibra de amianto é um perigo à 
saúde bastante conhecido. O artigo ‘The Acute Effects 
of Chrysotile Asbestos Exposure on Lung Function” 
(Environ. Research , 1978, p. 360-372) relata resultados 
de um estudo com base em uma amostra de operários 
de construção expostos ao amianto durante um longo 
período. Dentre os dados fornecidos no artigo. 8 me- 
ses após o período de exposição, os seguintes valores 
(ordenados) de complacência pulmonar (cm Vem FU0) 
foram apresentados em cada uma das 16 pessoas (a 
complacência pulmonar é uma medida da elasticidade 
do pulmão, ou como os pulmões, de maneira eficaz, sào 
capazes de inalar e exalar): 

167.9 180,8 184,8 189,8 194,8 200,2 

201.9 206,9 207,2 208,4 226,3 227,7 

228.5 232,4 239,8 258,6 

a. É plausível que a distribuição da população seja 

normal? 

b. Calcule o IC de 95% para a complacência pulmonar 
média real após a exposição. 

c. Calcule o intervalo que, com um nível de confiança de 
95%, inclua pelo menos 95% dos valores de com- 
placência pulmonar na distribuição da população. 

57. No Exemplo 6.7, introduzimos o conceito de um expe- 
rimento censurado em que n componentes são testados 
e que o experimento termina logo que r dos compo- 
nentes tiver falhado. Suponha que a vida útil dos com- 
ponentes seja independente, cada um com uma dis- 
tribuição exponencial com parâmetro À. Represente por 
Y | a hora em que ocorre a primeira falha, por Y 2 a hora 


em que ocorre a segunda falha, e assim por diante, de 
modo que T r = Y x + • • • + Y r 4* (w — r)Y r seja a vida 
útil total acumulada no fim. Então, é possível mostrar 
que 2ÁT r possui uma distribuição qui-quadrada com gl 
de 2r. Use esse fato para desenvolver uma fórmula de 
IC de 100(1 — a)% da vida útil média real de 1/À. Cal- 
cule o IC de 95% a partir dos dados no Exemplo 6.7. 

58. Seja por X p X 2 , .... X„ a amostra aleatória de uma dis- 
tribuição de probabilidade contínua que tem mediana jl 
(de modo que P(X, < jl) = P(X, > jl) = 0,5). 

a. Mostre que 

P(mín(X,) < /x < máx(X,)) = 1 - 

para que (mín(jt,), máx(jt,)) seja um intervalo de con- 
fiança de 100(1 - or)%depícom a = (i) * '. [Suges- 
tão: o complemento do evento { mín(X,) < jl < 
máx(X,)} é (máx(X,) < jl) U {mín(X,) > jl }. Mas 
máx(X,) < jl se é somente se X, ^ jl para todos os /.] 

b. Para cada um dos seis meninos normais, a quanti- 
dade do aminoácido alanina (mg/100 mL) foi deter- 
minada enquanto as crianças estavam em uma dieta 
sem isoleucina, resultando nos seguintes dados: 

2,84 3,54 2,80 1,44 2,94 2,70 

Calcule o IC de 97% da quantidade mediana real de 
alanina das crianças nessa dieta (‘The Essential 
Amino Acid Requirements of Infants,” Amer. J. Nu- 
trition , 1964, p. 322-330). 

c. Seja X( 2 ) o segundo menor x, e o segundo 

maior Qual é o coeficiente de confiança do inter- 
valo (x (2) , *<„_„) para £? 

59. Seja Xj, X 2 . X n a amostra aleatória de uma dis- 
tribuição uniforme no intervalo [0, 0], de modo que 


fix) = 


\_ 

0 

0 


0< 0 
caso contrário 


Então, se Y = máx(X ; ), é possível mostrar que a va U = 
Y/d possui função densidade 



0 < u < 1 
caso contrário 


a. Use f(j(u) para verificar que 

p((a/2)' ,n < ~ s ( 1 - a/2) Un ) = 1 - a 

e use a expressão para encontrar o IC de 100(1 - a)% 
para 0. 

b. Verifique se P(a i,n < Y/0 < 1) = 1 - a e encontre o 
IC de 100(1 - a)% para 0 com base nessa decla- 
ração de probabilidade. 

c. Qual dos dois intervalos deduzidos anteriormente é 
menor? Se meu tempo de espera por um ônibus, pela 
manhã, for uniformemente distribuído e os tem- 
pos de espera observados forem jc, = 4,2, jc 2 = 3,5, 
*3 = 1,7, x 4 = 1,2, e x 5 = 2,4, encontre o IC de 95% 
para 0 usando o intervalo menor. 
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60. Seja 0 < y < a. Então, o IC de 100(1 - a) % para /jl 
quando n for grande é 

A escolha y = a/2 produz o intervalo usual encontrado 
na Seção 7.2; se y ± a/2 , esse intervalo não é simétrico 
em tomo de 3c. A amplitude desse intervalo é w = 
s(z y + z a _ r )/Vn. Mostre que w é minimizado para 
y = a/2, de modo que o intervalo simétrico é o menor. 
[ Sugestões : (a) pela definição de z a , 4>(z a ) = 1 - a, de 
modo que z a - <& _, (1 — a); (b) a relação entre a de- 
rivada de uma função y = f(x) e a função inversa x = 

r\y) 6 (< d/dy)f-\y ) = 1 //'(*).] 

61. Suponha que x 2 * ..., x w sejam valores observados que 
resultam de uma amostra aleatória de distribuição 
simétrica, porém possivelmente de cauda longa. Sejam 
x e f s a mediana da amostra e a quarta dispersão, res- 
pectivamente. O Capítulo 1 1 de Understanding Robust 
and Exploratory Data Analysis (consulte a bibliografia 
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do Capítulo 6) sugere o seguinte IC robusto de 95% 
para a média da população (ponto de simetria): 

- -H / valor crítico de t conservativo \ . fs 
\ 1,075 / Vn 

O valor da quantidade entre parênteses é 2,10 para 
n = 10, 1,94 para n = 20 e 1,91 para n = 30. Calcule 
esse IC para os dados do Exercício 45, e compare ao IC | 
de t apropriado para a distribuição de uma popula- ! 
ção normal. 

62. a. Use os resultados do Exemplo 7.5 para obter o limi- I 
te de confiança inferior de 95% do parâmetro A de I 
uma distribuição exponencial, e calcule o limite com 
base nos dados fornecidos no exemplo, 
b. Se a vida útil X tem uma distribuição exponencial, a 
probabilidade de a vida útil exceder t é P(X > t) = J 
e ~ Á/ . Use o resultado da parte (a) para obter o limite de I 
confiança inferior de 95% para a probabilidade de o I 
tempo de quebra exceder 100 min. 


saber sobre os intervalos estatísticos (confiança, pre- 
visão, tolerância e outros). 

LARSEN, Richard e MARX, Morris, Introduction to Ma- 
thematical Statistics (2. ed.), Prentice Hall, Englewood 
Cliffs, NJ: 1986. Semelhante à apresentação de DeGroot, I 
mas levemente menos matemático. 






Respostas dos Exercícios 
de Numeração ímpar 


Capítulo 1 

1. a. Los Angeles Times , Oberlin Tribune, Gainesville 
Sun , Washington Post 

b. Duke Energy, Clorox, Seagate, Neiman Marcus 

c. Vince Corrêa, Catherine Miller, Michael Cutler, 
Ken Lee 

d. 2,97; 3,56; 2,20; 2,97 

3. a. Qual a probabilidade de, se mais da metade dos VCRs 
amostrados precisarem ou precisaram do serviço de ga- 
rantia? Qual é o número esperado entre os 1 00 que preci- 
sarem do serviço de garantia? Qual a probabilidade disso 
se o número dos que estão necessitando de serviço de 
garantia exceder o número esperado em mais do que 10? 
b. Suponha que 15 de 100 amostrados precisaram do 
serviço de garantia. Quão confiantes podemos estar de 
que a proporção de todos os VCRs que precisam de ser- 
viço de garantia estão entre 0,08 e 0,22? A amostra 
fornece evidência incontestável que permite concluir 
que mais do que 10% de todos VCR’s precisam de 
serviço de garantia? 

5. a. Não. Todos os estudantes que fizeram um grande 
curso de estatística foram os que participaram de um 
programa de SI deste tipo. 

b. A aleatoriedade protege contra vários desvios e ajuda 
a garantir que todos os do grupo SI sejam tão semelhan- 
tes quanto os estudantes do grupo de controle. 

c. Não haveria bases sólidas para o cálculo efetivo do 
SI (nenhum dos quais a pontuação SI poderia ser ra- 
zoável quando comparada). 

7. Pode-se gerar uma amostra aleatória simples de todas 
as casas de família na cidade ou uma amostra aleató- 
ria estratificada tomando uma aleatória simples de cada 
um dos 10 bairros vizinhos. A partir de cada casa 
selecionada, os valores de todas as variáveis desejadas 
deveriam ser determinados. Isso seria um estudo enu- 
merativo, pois existe uma população de objetos finita e 
identificável a partir da qual amostrar. 


9. a. Possivelmente erro de medida, erro de registro, dife- 
renças nas condições ambientais no tempo de medida etc. 
b. Não. Não há quadro de amostragem. 


11. 6L 

430 

6H 

769689 

7L 

42014202 

7H 


8L 

011211410342 

8H 

9595578 

9L 

30 

9H 

58 


A lacuna nos dados — sem contagem acima de 70. 

13. a. 12 2 folha: dígito das unidades 
12 445 
12 6667777 

12 889999 

13 00011111111 

13 222222222233333333333333 
13 < 144444444444444 44 4 55555555555555555555 
13 6666666666667777777777 

13 888888888888999999 

14 0000001111 
14 2333333 

14 444 
14 77 
simetria 

b. Próximo do formato de sino, centro * 135, dispersão 
significativa, sem lacunas ou outliers. 


15. Crocante 

Cremoso 


2 

2 

644 

3 

0069 

77220 

4 

00145 

6320 

5 

003666 

222 

6 

258 

55 

7 


0 

8 



caule: dezenas 
folha: unidades 


665 


666 Probabilidade e Estatística - Editora Thomson 


Ambos os conjuntos de contagens são muito dispersos. 
Parece não haver outliers. A distribuição de contagens 
de crocantes parece estar deslocada para a direita (na di- 
reção dos valores maiores) do que para contagens de 
cremosas por algo na ordem de 10. 


17. a. # Não-conformidade Freqüência 

Freq. Rei. 

0 

7 

0,117 

1 

12 

0,200 

2 

13 

0,217 

3 

14 

0.233 

4 

6 

0,100 

5 

3 

0,050 

6 

3 

0,050 

7 

1 

0.017 

8 

1 

0,017 


60 

1,001 

b. 0,917, 0,867, 1 - 0,867 = 0,133 


c. O histograma tem uma inclinação substancialmente 
positiva. Está centrado em algum lugar entre 2 e 3 e dis- 

persa-se um pouco em seu centro. 


19. a. 0,99 (99%), 0,71 (71%) 


b. 0,64 (64%), 0,44 (44%) 


c. Estritamente falando, o histograma não é unimodal, 
mas está próximo de ser, portanto com uma inclinação 
positiva moderada. Um tamanho de amostra muito maior 
resultaria provavelmente em uma figura mais plana. 

21. a. y Freq. 

Freq. Rei. b. z Freq. 

Freq. Rei. 

0 17 

0,362 0 13 

0,277 

1 22 

0.468 1 1 1 

0.234 

2 6 

0,128 2 3 

0,064 

3 1 

0.021 3 7 

0,149 

4 0 

0,000 4 5 

0,106 

5 _L 

0.021 5 3 

0,064 

47 

1,000 6 3 

0,064 


7 0 

0,000 

0,362; 0,638 8 _2_ 

0,043 


47 1,001 

0,894; 0,830 

23. a. Classe Freq. Freq. Rei. 


0-<100 

21 

0.21 

100 -<200 

32 

0,32 

200-<300 

26 

0,26 

300-<400 

12 

0,12 

400-<500 

4 

0,04 

500-<600 

3 

0,03 

600-<700 

1 

0,01 

700-<800 

0 

0,00 

800-<900 

1 

0,01 


1,00 


b. Classe Freq. Freq. Rei. 

Densidade 

0-<50 8 

0.08 

0,0016 

30-<100 13 

0,13 

0,0026 

100-<150 11 

0,11 

0,0022 

150-<200 21 

0,21 

0,0042 

200-<300 26 

0,26 

0.0026 

300 -<400 12 

0,12 

0,0012 

400 -<500 4 

0,04 

0,0004 

500-<600 3 

0,03 

0,0003 

600 -<900 2 

0,02 

0,00007 

100 

1.00 


c. 0,79 



Classe Freq. 

Classe 

Freq. 

10-<20 8 

1,1 — <1,2 

2 

20-<30 14 

1 ,2— < 1 ,3 

6 

30-<40 8 

1 ,3-< 1 .4 

7 

40-<50 4 

1 ,4-< 1 ,5 

9 

50-<60 3 

1 ,5-< 1 ,6 

6 

60-<70 2 

1 ,6— < 1 ,7 

4 

70-<80 1 

1,7— < 1 ,8 

5 

40 

1 ,8-< 1 ,9 

1 



40 

Original: inclinada positivamente; 


Transformada: muito 

mais simétrica. 

não distante da 

forma de sino. 



a. A observação 50 cai em uma classe limite. 

b. Classe 

Freq. 

Freq. Rei. 

0-<50 

9 

0,18 

50-<100 

19 

0,38 

100-<150 

11 

0,22 

150-<200 

4 

0,08 

200-<300 

4 

0,08 

300-<400 

2 

0,04 

400 -<500 

0 

0,00 

500-<600 

1 

0,02 


50 

1,00 

Um valor (central) representativo é tanto um pouco 

abaixo como um pouco acima de 100, dependendo de 

como se mede o centro. Há grande variação na vida útil, 

especialmente nos valores na extremidade superior dos 

dados. Há vários candidatos à outliers. 


c. Classe 

Freq. 

Freq. Rei. 

2,25-<2.75 

2 

0,04 

2,75-<3,25 

2 

0.04 

3.25-<3.75 

3 

0.06 

3.75-<4,25 

8 

0,16 

4,25-<4,75 

18 

0,36 

4,75-<5,25 

10 

0,20 

5,25-<5,75 

4 

0,08 

5,75-<6,25 

3 

0,06 


50 

1,00 


Há muito mais simetria na distribuição dos valores de 
ln(jc) do que nos valores x em si mesmos, e menos va- 
riabilidade. Não há lacunas grandes ou óbvios outliers. 
d. 0,38; 0,14. 


100 


Respostas dos Exercícios de Numeração ímpar - Jay L. Devore 667 


29. Reclamação 

Freq. 

Freq. Rei. 

j 


10 

0.1667 

F 


9 

0,1500 

B 


7 

0.1167 

M 


4 

0.0667 

C 


3 

0.0500 

N 


6 

0,1000 

O 


21 

0,3500 



60 

1.0001 

31. Classe 

Freq. 

Freq. Acum. 

Freq. Rei. Acum. 

0-<4 

2 

2 

0,050 

4-<8 

14 

16 

0,400 

8— < 1 2 

11 

27 

0,675 

1 2— < 1 6 

8 

35 

0,875 

16-<20 

4 

39 

0,975 

20-<24 

0 

39 

0,975 

24-<28 

1 

40 

1,000 


33. a. x = 192,57, x = 189,0 

b. Novox = 189,71; x inalterado 

c. 191,0; 7,14% d. 122,6 


35. a. x = 12,55, x = 12,50, x,*,^) = 12,40. Deleção da 
maior observação (18,0) faz com que xe x lr sejam um 
pouco menores do que x. 

b. Por no máximo 4.0 


c. Não; multiplique os valores de x e x pelo fator de 
conversão 1/2,2. 


37. x tr < io) 1 1,46 

39. a. x = 1,0297, jc = 1,009 b. 0,383 
41. a. 0,7 b. Também 0,7 c. 13 
43. x 68,0, Xir( 20 ) 66,2, x^^) ~ 67,5 

45. a. x = 1 15,58; os desvios são 0,82; 0,32; -0,98; 
-0,38; 0,22 

b. 0,482; 0,694 c. 0,482 d. 0,482 

47. x = 1 16,2, s = 25,75. A magnitude de s indica uma 
quantidade substancial de variação em tomo do centro 
(um desvio “representativo” de aproximadamente 25). 

49. a. 0,56,80; 197,8040 b. 0,5016; 0,708 
51. a. 1264,766; 35,564 b. 0,351; 0,593 


53. a. 2,74; 3,88 b. 1,14 c. Inalterado 

d. No máximo 0,40 e. 1,19 


55. a. 33 b. Não 

c. Inclinação positiva leve na metade do meio, 
mas simétrica no todo. A extensão da variabilidade 
parece significativa 

d. No máximo 32 


57. a. Sim. 125,8 é um outlier extremo e 250,2 é uma ou- 
tlier moderado. 

b. Além da presença de outliners, há inclinações positi- 
vas ambas em 50% do meio dos dados e, excetuando os 
outliers, em todo ele. Exceto para os dois outliers, 


parece haver uma quantidade relativamente pequena de 
variabilidade nos dados. 

59. a. ED: 0,4; 0,10; 2,75; 2,65; 

Não-Ed: 1,60: 0,30; 7,90; 7,60 

b. ED: 8,9 e 9,2 são outliers moderados e 1 1,7 e 21,0 
são outliers extremos. 

Não há outliners na amostra não-ED. 

c. Quatro outliers para ED, nenhum para não-ED. In- 
clinação positiva significativa em ambas as amostras; 
menos variabilidade em ED (o menor/) e observações 
não-ED tendem a ser algo maiores do que as obser- 
vações ED. 

61. Outliers, ambos moderados e extremos, apenas às 6 da 
manhã. As distribuições em outros horários são bem 
simétricas. A variabilidade aumenta consideravel- 
mente até 14h e então diminui ligeiramente, e o mesmo 
acontece para os valores de coeficiente gasolina- 
vapor “típicos”. 

63. Baseadas em um boxplot comparativa, as três amostras 
parecem significativamente diferentes em relação ao 
centro. Há muito menos variabilidade para a taxa de 
fluxo de 160 do que para as duas outras taxas. Nenhum 
outlier presente. Há evidência de inclinação positiva 
moderada nos 50% do meio de cada amostra, mas não 
para a amostra da taxa de fluxo de 160 ou a amostra da 
taxa de fluxo de 200 como um todo. 

65. a. 9,59; 59,41 

b. CV = 0,396 para HC e = 0,323 para CO, portanto há 
maior variabilidade relativa nos dados de HC ainda que 
seu DP seja muito menor. 

67. 10,65 

69. a . y = àx + b, s$ = a 2 s 2 x b. 189,14; 1,87 

71. a. A média, a mediana e a média ordenada são virtual- 
mente idênticas, sugerindo uma quantidade substancial 
de simetria nos dados: o fato de os quartis terem aproxi- 
madamente as mesmas distâncias da mediana e de as 
menores e maiores observações serem aproximada- 
mente eqüidistantes do centro fornece suporte adicional 
para a simetria. O desvio padrão é bem pequeno em re- 
lação à média e à mediana. 

b. Veja os comentários de (a). Além disso, utilizando 
1,5(Q3 - Ql) como padrão de medida, as duas maiores 
e as três menores observações são outliers moderados. 

73. x = 0,9255, s = 0,0809, x = 0,93, quantidade pequena 
de variabilidade, um pouco de inclinação. 

75. a. Os “resumos de cinco números” (x, os dois quar- 
tos e a menor e a maior observações) são idênticos e 
não há outliers, portanto os três boxplots individuais 
são idênticos. 

b. Diferenças na variabilidade, natureza das lacunas e 
existência de agrupamentos para as três amostras. 

c. Não. Detalhe foi perdido. 
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77. a. 0 
1 

2 

3 

4 


2355566777888 

0000135555 

00257 

0033 

0057 caule: unidades 


Classe 

Freq. 

Freq. Rei. 

Densidade 

0-<2 

23 

0,500 

0,250 

2-<4 

9 

0,196 

0.098 

4-<6 

7 

0,152 

0,076 

6-C10 

4 

0,087 

0,022 

10-<20 

1 

0,022 

0,002 

20-<30 

2 

0,043 

0.004 


5 

6 


044 


folha: dezenas 


79. a. *„+, = (nx„ + .,)/(« + 1) 

c. 12,53; 0,532 


7 

8 

9 

10 
Hl 


05 

8 

0 

3 

22,0; 24,5 


81. Uma inclinação substancial positiva (assumindo uni- 
modalidade) 

83. a. Todos os pontos caem em uma reta de 45°. Os pontos 
caem abaixo de uma reta de 45°. 

b. Os pontos caem bem abaixo de uma reta de 45° in- 
dicando uma inclinação substancial positiva. 


Capítulo 2 


1. a. {1324, 3124, 1342, 3142, 1423, 1432, 4123, 
4132, 2314, 2341, 3214, 3241, 2413, 2431. 4213,4231 } 

b. A = {1324, 1342, 1423, 1432} 

c. B = {2314. 2341, 3214, 3241, 2413, 2431, 
4213,4231} 

d. AU8= {1324, 1342, 1423, 1432, 2314, 2341, 
3214, 3241, 2413, 2431, 4213, 4231 }, 

A fl B não contém saídas (A e B são disjuntos), 

A' = {3124,3142,4123,4132,2314, 2341,3214. 3241, 
2413,2431.4213, 4231} 

3. a. A = {SSF, SFS, FSS} 

b. B = {SSF. SFS, FSS. SSS} 

c. C= {SFS, SSF, SSS} 

d. C = {FFF. FSF, FFS. FSS. SFF}, 

A U C = {SSF. SFS, FSS, SSS}, 

Ar\C= {SSF. SFS}, 

BUC = {SSF, SFS. FSS, SSS} = B, 
snc = {SSF. SFS, SSS} = c 


19. a. 0.8841 b. 0,0435 

21. a. 0,10 b. 0,18; 0,19 c. 0,41 d. 0,59 

e. 0,31 f. 0,69 

23. a. 0,067 b. 0,400 c. 0,933 d. 0,533 
25. a. 0,98 b. 0,02 c. 0,03 d. 0,24 
27. a. 0,1 b. 0,7 c. 0,6 
29. a. 20 b. 60 c. 10 

31. a. 243 b. 3.645 dias (aproximadamente 10 anos) 
33. a. 53,130 b. 1.190 c. 0.022 d. 0,023 
35. 0,20 
37. 0,0456 


39. a. 0.0839 b. 0,24975 

41. a. 0.929 b. 0,0714 c. 0.99997520 

43. 0.000394; 0.00394; 0,00001539 


5. a. .?= {(1, 1, 1), (1, 1, 2), (1, 1, 3), (1, 2, 1), (1, 2, 2), (1, 
2, 3), (1, 3, 1), (1, 3, 2). (1, 3, 3), (2. 1, 1), (2, 1, 2), (2, 1, 
3), (2, 2, 1), (2, 2, 2), (2, 2, 3), (2, 3, 1), (2, 3, 2), (2, 3, 3), 
(3, 1, 1), (3, 1, 2), (3, 1, 3), (3, 2, 1), (3, 2, 2), (3, 2, 3). (3, 

3. 1) , (3, 3, 2), (3, 3, 3)} b. {(1, 1, 1), (2, 2, 2), (3, 3, 
3)} c. {(1,2, 3), (1,3, 2), (2, 1,3), (2, 3.1), (3. 1.2), 
(3, 2, 1)} d. {(1, 1, 1), (1, 1, 3), (1, 3, 1), (1, 3, 3), (3, 

1.1) , (3,1,3), (3, 3,1), (3, 3, 3)} 

7. a. Há 35 resultados de S. b. [AABABAB, AABAABB, 
AAABBAB, AAABABB. AAAABBB } 

11. a. 0.07 b. 0,30 c. 0,57 

13. a. 0.36 b. 0,64 c. 0,53 

d. 0.47 e. 0,17 f. 0,75 

15. a. 0,572 b. 0,879 

17. a. Há pacotes de software estatísticos além do SPSS e 
do SAS. 

b. 0,70 c. 0,80 d. 0,20 


45. a. 0,447; 0,500; 0,200 b. 0,400; 0,447 c. 0,211 

47. a. 0,50 b. 0,50 c. 0,625 
d. 0,375 e. 0,769 

49. 0,217; 0,178 
51. 0,436; 0,581 
53. 0,083 

55. a. 0,01 1 1 b. 0,333 c. 0,2 
59. a. 0,21, b. 0,455 . c. 0,264; 0,274 

61. a. 0,578; 0,278; 0,144 b. 0; 0,457; 0.543 
63. b. 0,54 c. 0,68 d. 0,74 e. 0,7941 

65. «Média | S) = 0,3922, «Mediana | S) = 0.294 1 , por- 

tanto Média e Mediana são mais e menos prováveis, 
respectivamente. 

67. a. 0,126 b. 0,05 

d. 0,2725 e. 0,5325 


c. 0,1125 
f. 0,2113 
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69. a. 0.300 b. 0,820 c. 0,146 

73. 0,401:0,722 

75. a. 0.06235 b. 0,00421 

77. 0,0059 

79. a. 0,95 

81. a. 0.10:0,20 b. 0 

83. a. p( 2 - p) b. 1 - (1 - p)" c. (1 - pf 

d. 0.9 + (1 - p) 3 (0,l) 

e. 0,1(1 - p)7[0,9 + 0,1(1 - pf\ = 0,0137 parap = 0,5 
85. 0,8588; 0,9897 

87. [2tt( 1 - 7r)]/( 1 - 7T 2 ) 

89. a. 0,333:0.444 b. 0,150 c. 0,291 
91. 0,45; 0,32 


93. a. 0.0083 b. 0,2 c. 0,2 
95. 0,905 

97. a. 0,956 b. 0,994 
99. 0,926 

101. a. 0,018 b. 0,601 

103. a. 0,883:0,117 b. 23 c. 0,156 

105. 1 - (1 - p,)(l - p 2 ) (1 - p„) 

107.a.0,0417 b. 0,375 

109. P(contratação do n a 1) = 6/24 para 5 = 0,= 11/24 
para 5=1,= 10/24 para s = 2 e = 6/24 para 5 = 3, 
portanto s = 1 é melhor. 

ui. i/4 = m, n3j n/i,) 

* P(A,) • mj • P(A y ) = 1/8 


Capítulo 3 

1. X = 0 para FFF; x = 1 para SFF, FSF e FFS; x=2 
para SSF, SFS e FSS; e x = 3 para SSS 

3. Z = média de dois números, com valores possíveis 2/2, 
3/2, ... 12/2: W = valor absoluto da diferença, com va- 
lores possíveis 0, 1,2, 3, 4, 5 

5. Não. No Exemplo 3.4 assumimos Y = 1 se no máximo 
três baterias são examinadas e assumimos Y = 0 caso 
contrário. Então Y tem apenas dois valores. 

7. a. {0, 1 12}; discreto c. {1, 2, 3, ...}; discreto 

e. {0, c, 2c, ..., 10.000c}, onde c é o direito autoral por 
livro; discreto g. {x: m < jc < M) onde m (M) é a 
tensão mínima (máxima) possível; contínua 

9. a. {2, 4, 6, 8, ...}, ou seja, {2(1), 2(2), 2(3), 2(4), ...}, 
uma seqüência infinita; discreta 
b. {2, 3, 4, 5, 6, ...}, ou seja, {1 + 1, 1 + 2, 1 + 3, 1 + 
4, ...}, uma seqüência infinita; discreta 

11. a. p( 4) = 0,45, p(6) = 0,40, p{S) = 0,15,/?(jc) = Opara 
jc*4,6ou 8 c. 0,55; 0,15 

13. a. 0,70 b. 0,45 c. 0,55 

d. 0,71 e. 0,65 f. 0,45 

15. a. (1, 2), (1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5), (3, 
4), (3, 5), (4, 5) b. p( 0) = 0,3, p( 1 ) = 0,6, p( 2) = 

0. 1 c. F(x) = 0 para x < 0, = 0,3 para 0 ^ x < 

1 , = 0,9 para 1 2e = 1 para 2 ^ x 

17. a. 0,81 b. 0,162 c. É A; AUUUA, UAUUA, 
UUAUA, UUUAA; 0,00405 

19. p(l) = p( 2) = p(3) = p(4) = 0.25 

21. F(x) = 0 para jc < 0, = 0,10 para 0Sr< 1, = 0,25 
para 1 ^ x < 2, = 0,45 para 2 < * < 3, = 0.70 para 
3 S x < 4, = 0,90 para 4 s x < 5, = 0,96 para 5 ^ 
x < 6 e = 1 para 6 ^ x 

23. a. p(\) = 0,30, p(3) = 0,10, p( 4) = 0,05, p{ 6) = 0,15, 
p( 1 2) = 0,40 b. 0.30,0,60 


25. a. p(x) = (f)* 1 • (y) para x= 1, 2, 3, ... 

b. p(y ) = (f)'- 2 • (y) para y = 2, 3, 4, 5, .. 

c. P(z) = (£) -(f) 21 ' 2 para r= 1,2, 3,... 
29. a. 0.60 b. $110 


31. a. 16,38; 272,298; 3,9936 b. 401 c. 2.496 
d. 13,66 

33. Sim. porque X7=i l/-* 2 < °°- 
35. $700 

37. E(h{X)) = 0,408, portanto joga. 


39. V(-X) = V(X) 

41. a. 32,5 b. 7,5 

c. V(X) = E[X(X - 1)] H 

43. a. 0.25; 0,11; 0.06; 0,04; 
conservativo c. Eles 
0,02 = p(l),p(0) = 0.96 

45. a. 0,850 b. 0.200 
e. 0.851 f. 0.000 

47. a. 0,354 b. 0,115 

49. a. 0.403 b. 0,787 

51. 0,1478 


E(X) - [£(X)] 2 

0,01 b. 2,64; 1,54:0,04, 
são iguais d. p(-l) = 

c. 0.200 d. 0,701 

g. 0,570 

c. 0,918 
c. 0,774 


53. 0,407, independência 

55. a. 0,0 17 b. 0.8 1 1 ; 0,425 c. 0.006; 0,902; 0.586 


57. Quando p = 0,9, a probabilidade é 0,99 para A e 0,9963 
para B. Se p = 0,5, estas probabilidades são 0.75 e 
0.6875. respectivamente 


59. A tabulação para p > 0,5 é desnecessária 
61. a. 20, 16 b. 70, 21 

63. P( | X — p. | s 2a) = 0,042 quando p = 0,5 e = 0,065 
quando p = 0,75, comparado ao limite superior de 0,25. 
Usando k = 3 no lugar de k = 2, estas probabilidades 
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são 0,002 e 0,004, respectivamente, considerando que o 
limite superior é 0,1 1. 

65. a. 0.114 b. 0,879 c. 0,121 d. Use a dis- 
tribuição com n = 15, p = 0,10 

67. a. h(x; 15, 10, 20) para x = 5 10 

b. 0.0325 c. 0,697 

69. a. h(x; 10, 10. 20) b. 0,033 

71. a. nb(x; 2, 0,5) b. 0,188 c. 0,688 d. 2, 4 

73. nb(x; 6; 0,5), 6 

75. a. 0,932 b. 0,065 c. 0,068 

d. 0,492 e. 0,251 

77. a. 0,011 b. 0,441 c. 0,554; 0,459 d. 0,945 
79. Poisson(5) a. 0,492 b. 0,133 

81. a. 0,313; 0,809; 0.283 b. 12; 3,464 

c. 0,530:0,011 

83. a. 0,099 b. 0,135 c. 2 

85. a. 4 b. 0,215 c. Pelo menos -ln(0,l)/2 * 
1,1513 anos 


87. a. 0,221 b. 6.800.000 c. p(x; 20,106) 

91, b. 3,114; 0,405;0,636 

93. a. b(x; 15; 0,75) b. 0,686 

c. 0,313 d. 11,25; 2,81 e. 0,310 

95. 0,991 

97. a. p(x; 2,5) b. 0,067 c. 0,109 
99. 1,813; 3,05 

101. p( 2) = p\ p( 3) = (1 - p)p\ p( 4) = (1 - p)p\ p(x) = 
[1 - p(2) — »>- p( x - 3)](1 - p)p 2 para x = 5, 
6, 7, 0,99950841 

103. a. 0,0029 b. 0,0767; 0,9702 
105.a.0,135 b. 0,00144 c. Z^olpCc; 2)] J 
107. 3,590 

109. a. Não b. 0,0273 

111. b. 0,6 p(x; À) 4- 0Ap(x; p) c. (A + p)/2 

d. (A - p) 2 /4 + (A + p)f2 

113. Z'2i(Pi+y + i + Pí-j- i )P» onde p k = 0 se k < 0 ou k > 10. 


Capítulo 4 

1. a. 0,25 b. 0,50 c. 0,4375 

3, b. 0.5 c. 0.6875 d. 0,6328 

5. a. 0,375 b. 0,125 c. 0.297 d. 0,578 

7. a. f(x) = 0,1 para 25 < x s 35 e 0 caso contrário 

b. 0,20 c. 0,40 d. 0,20 

9. a. 0,562 b. 0,438; 0,438 c. 0,071 

11. a. 0,25 b. 0,1875 c. 0,9375 d. 1,4142 

e. /( x) = x/2 para 0 < x < 2 

f. 1,33 g. 0,222; 0,471 h. 2 

13. a. 3 b. 0 para x s 1, 1 - x" 3 para x > 1 

c. 0,125:0,088 d. 1,5; 0,866 e. 0,924 

15. a. F(x) = 0 para x s 0, = 90[- - Q para 0 < x < 1, = 
1 paraxS 1 b. 0,0107 c. 0,0107; 0.0107 

d. 0,9036 e. 0,8 1 8; 0, 1 1 1 f. 0,3 1 37 

17. a. Para 2 < x < 4. F(x) = 0,25[3x - 7 - (x - 3) } J 

b. 3 c. 3; 0,2 

19. a. 0,597 b. 0,369 

c. f(x) = 0,3466 - 0,25 ln(x) para 0 < x < 4 

21. 314,79 
23. 248; 3.60 

25. b. 1 ,8(o nonagésimo percentil para X) + 32 

c. a(X percentil) + b 

27. a. 2,14 b. 0,81 c. 1,17 

d. 0,97 e. 2,41 

29. a. 2,54 b. 1,34 c. -0,42 

31. a. 0,9918 b. 0,0082 c. 0,9544 


33. a. 0,3336 b. Aproximadamente 0 

c. 0,5795 d. 6,524 e. 0,8028 

35. a. 36,7 b. 22,225 c. 3,179 
37. 0,002 
39. 10; 0,2 
41. 7,3% 

43. 21,155 

45. a. 0,1190:0.6969 b. 0.0021 c. 0,7054 

d. >5020 ou <1844 (usando Zo.ooos = 3.295) 

e. Normal, p = 7,576, cr = 1 ,064; 0,7054 

47. 0,3174 para k = 1; 0,0456 para k = 2; 0,0026 para 
k = 3, quando comparado com os limites de 1,25 e 
0,1 1 1, respectivamente. 

49. a. Exato: 0,212, 0,577, 0,573; Aproximado: 0,211, 
0,567; 0.596 b. Exato: 0,885; 0,575; 0,017; Apro- 
ximado: 0,885: 0,579; 0,012 c. Exato: 0,002; 
0.029; 0.617; Aproximado: 0,003; 0,033; 0,599 

51. a. 0,9666 b. 0,0099: 0 
53. b. Normal, p = 239, cr- = 12,96 

55. a. 120 b. 1,329 c. 0,371 

d. 0,735 e. 0 

57. a. 5,4 b. 0,715 c. 0,41 1 
59. a. 1 b. 1 c. 0.982 d. 0,129 
61. a. 0,449; 0,699; 0.148 b. 0.05; 0,018 

63. a. n A, b. Exponencial com A = 0,05 
c. Exponencial com parâmetro nÁ 
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67. a. 0,826; 0,826; 0,0636 b. 0,664 c. 172,727 
71. a. 0,930 b. 0,298 c. 98,18 

73. a. 68,0; 122,1 b. 0,3204 

c. 0,7257, inclinação 

75. a. 149,157, 223,595 b. 0,9573 c. 0,0414 

d. 148,41 e. 9,57 f. 125,90 

77. a = p 

79. b. [T(a + P) • T(/n + P)]/[T(a + p + m) • T(/3)], 

PUa + p) 

81. Sim, visto que o padrão na marcação é bem linear. 

83. Sim 
85. Sim 

87. Marcação ln(jc) versus percentil z. O padrão é retilíneo, 
portanto uma distribuição de população lognormal é 
plausível. 

89. O padrão na marcação é bem linear; é muito plausível 
que a força seja distribuída normalmente. 

91. Há curvatura considerável na marcação. A é um parâ- 
metro de escala (como é <x para a família normal). 

93. a. F(y) = ~(y 2 - y VI 8) para 0 < y < 12 

b. 0,259; 0,5; 0,241 c. 6; 43,2; 7,2 
d. 0,518 e. 3,75 

95. a. /(jc) = x 2 para 0 < jc < 1 e = y - |jc para 1 < jc 

b. 0,917 c. 1,213 


97. a. 0,9162 b. 0,9549 c. 1,3374 

99. a. 0,3859 b. 0,0663 c. (72,97; 119,03) 

101. b. F(jc) = 0 para jc < — 1, = (4jc — jc73)/9 + £ para 
- 1 < jc < 2 e = 1 para jc > 2 

c. Não. F(0) < 0,5 p > 0 

d. Y ~ Bin(10, jj) 

103. a. 0,368; 0,828; 0,460 

b. 352,53 

c. \/p • exp[-exp(-(jc - a)/p)] • exp(-(jc - a)/p) 

d. a 

e. /x = 201,95, moda = 150, /i = 182,99 

105. a. p b. Não c. 0 
d. (a — \)P e. v — 2 

107. b. p(\ - exp(-À,Jc)) + (1 - p)( 1 - exp(-À 2 jc)) para 
jc ^ 0 c. p/A, + (1 - p)í\ , 

d. V(X) = 2p/A? + 2(1 - p)/A? - p 2 

e. 1, CV> 1 f. CV< 1 

109. a. Lognormal b. 1 c. 2,72; 0,0185 

113. a. Exponencial com A = 1 

c. Gama com parâmetros aecp 

115. a. (1/365) 3 b. (1/365) 2 c. 0,000002145 

117. b. Sejam m,, m 2 , w 3 , . . . uma seqüência de observações 
de uma distribuição Unif[0,l] (uma seqüência de 
números aleatórios). Então com jc, = (-0,l)ln(l - w,), 
os jc,s são observações de uma distribuição exponencial 
com A = 10. 

119. g(E(X)) ^ E(g(X)) 


Capítulo 5 


1. a. 0,20 b. 0,42 c. Pelo menos uma mangueira 

é utilizada em cada bomba: 0,70. d. p x (x ) = 0,16; 
0,34; 0,50 para x = 0, 1,2, respectivamente; p,iy) = 
0,24; 0,38; 0,38 para y = 0, 1,2, respectivamente; 0,50 
e. Não; p( 0, 0) * p x (Q) • p Y (0) 

3. a. 0,15 b. 0,40 c. 0,22 d. 0,17; 0,46 
5, a. 0.054 b. 0,00018 

7. a. 0,030 b. 0,120 c. 0,300 

d. 0,380 e. Sim 

9. a. 3/380,000 b. 0,3024 c. 0,3593 
d. lOfcc 2 + 0,05 para 20 s x £ 30 e. Não 

11. a. <r A " , ‘ • À r • p7/x\y\ b. • [1 + À + /x] 

c. e' (A+ '‘ ) • (À + /i)"/m!; Poisson (À + p) 

13. a. e~ x ~> para r 2: 0, y > 0 b. 0,400 c. 0.594 

d. 0,330 

15. a. F(y) = 1 — e~ h ' + (1 - e - (1 - e~ Áy y paray > 0 
b. 2/3A 

17. a. 0,25 b . 0,318 c. 0,637 

d. fÁ x) = 2V7? : — x*/vR 2 para -R < jc S /?; não 

19. a. AfC* 2 + y)K IOATjc 2 + 0,05); Ktf + fWOKy 1 + 0,05) 
b. 0,556; 0,549 c. 25,37; 2,87 


21, = f r (y) para todo x 
23. 0,15 
25. L? 


27. 5 h 
29. -j 

31. a. -0,1082 
37. a. x 


b. -0,0131 


P(i) 


25 32,5 40 45 52,5 65 

t £(X) = p = 44,5 

0,04 0.20 0,25 0,12 0,30 0,09 ’ 


b. s 2 

0 1 12^5 312,5 800 

r/c2\ — 

pU 2 ) 

39. Proporçã 

0,38 

io 

, — U 

0,20 0,30 0,12 

0 0,1 0,2 0,3 0,4 0,5 

Probabilidade 

Proporção 

0,000 0,000 0,000 0,001 0.005 0,027 

0,6 0,7 0,8 0,9 1,0 

Probabili 

41. a. 3c 

idade 

1 

0,088 0,201 0,302 0,269 0,107 
1,5 2 2,5 3 3,5 4 

Pix) 

b. 0.85 

0,16 0,24 0,25 0,20 0.10 0,04 0,01 
c. /• 0 1 2 3 


P( r) 


0,30 0,40 0,22 0,08 


672 Probabilidade e Estatística - Editora Thomson 


47. a. 0,6826 b. 0,1056 

49.a.0,6026 b. 0,2981 

51. 0,7720 

53. a. 0,0062 b. 0 

55. a. 0,0968 b. 0.8882 

57. 0,9616 

59. a. 0,9986; 0,9986 b. 0.9015; 0.3970 
c. 0,8357 d. 0,9525; 0,0003 

61. a. 3,5; 2,27; 1,51 b. 15,4; 75,94; 8,71 

63. a. 0.695 b. 4.0675 > 2,6775 
65. a. 0,9232 b. 0.9660 

67. 0,1588 

69. a. 2.400 b. 1.205; independência 
c. 2.400; 41,77 

71. a. 158; 430,25 b. 0,9788 

73. a. Aproximadamente normal com média = 105, DP = 
1,2649; Aproximadamente normal com média = 100, 
DP = 1,0142 


b. Aproximadamente normal com média = 5, DP = 
1,6213 

c. 0,0068 d. 0,0010, sim 

75. a. 0,2; 0.5; 0,3 para * = 12, 15, 20; 0,10; 0,35; 0,55 
para y = 12, 15, 20 b. 0,25 c. Não d. 
33,35 e. 3,85 

77. a. 3/81,250 b. f x (x) = k( 250* - lQx 2 ) para 0 ^ 
x £ 20 e = £(450* — 30*’ + ^Jt 1 ) para 20 < x ^ 30; 
/, (>■) resulta da substituição de y por x em f x (x). Eles não 
são independentes, 
c. 0,355 d. 25,969 
e. 204,6154; -0.894 f. 7,66 

79. = 1 

81. a. 400 min b. 70 
83. 97 
85. 0,9973 

89. b, c. Qui-quadrado com v = n. 

91. a. a : w /(cri + cri ) b. 0,9999 
93. 26; 1,64 


Capítulo 6 

1. a. 8,14, X b. 0,77, c. 1.66, S 
d. 0,148 e. 0,204, S/X 

3. a. 1,348, X b. 1,348, X 

c. 1.781.X + 1,285 

d. 0,6736 e. 0.0905 

5. 1,703,000; 1,591,300; 1,601.438,281 

7. a. 120,6 b. 1.206.000 c. 0.80 d. 120,0 

9. a. 2,11 b. 0,119 


rpi?i 



+ Vj 


c. Use p, = xjn, e q, = 1 - p, no lugar de p, e q, na parte 
(b) para /' = 1,2. 

d. -0,245 e. 0,041 


15. a. Ô = £X:/2n b. 74,505 
17. b. 0.444 

19. a. p = 2Â — 0,30 = 0,20 b. p = (100À - 9)/70 
21. b. â = 5 , j§ = 28,0/r(l,2) 

23. A, = x, Â 2 = y, estimado de (À, — À,) é x — y. 

25. a. 384,4; 18,86 b. 415,42 

29. a. 6 = mín(X,), Â = n/Z[X, — mín(X,)] 
b. 0,64; 0,202 

33. Com x, = tempo entre o nascimento - 1 e o nasci- 
mento i, Â = 6/X?-i ix, = 0,0436. 

35. 29,5 
37. 1,0132 


Capítulo 7 


1. a. 99,5% b. 85% c. 2,96 d. 1,15 

3. a. Mais estreito b. Não c. Não d. Não 

5. a. (4,52; 5,18) b. (4,12; 5,00) 
c. 0,55 d. 94 

7. Por um fator de 4; a largura é decrescente por um fator 
de 5. 

9. a. (3c - l,645o7Vn, <*>); (4,57, ~) 

b. (x- z a ‘ <rtVn. °®) c. (-°°, x + z a ’ orPSn); 
(-°°, 59,7) 


11. 950; 0,8714 

13. a. (0,990; 1,066) b. 158 
15. a. 80% b. 98% c. 75% 
17. 134,53 
19, (0,513; 0,615) 

21. 0,218 

23. a. (0,438; 0,814) 

25. a. 381 b. 339 


b. 659 
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29. a. 2,228 b. 2,086 c. 2,845 d. 2,680 

e. 2,485 f. 2,571 

31. a. 1,812 b. 1,753 c. 2,602 d. 3,747 

e. 2,1716 (do MINITAB) f. Aproximadamente 2,43 

33. a. Quantidade razoável de simetria, sem outliers 

b. Sim (baseado em uma marcação de probabilidade 
normal) 

c. (430,5; 446,1), sim, não 

35. a. 95% Cl: (2783,3; 2991,9) 

b. 95% PI: (2632,1; 3143,1), aproximadamente 2,5 
vezes mais largo 

37. a. (0,888; 0,964) b. (0,752; 1,100) 

c. (0,634; 1,218) 

39. a. Sim b. (6,45; 98,01) 

c. (18,63; 85,83) 

41. Todos os 70%; (c), porque é o mais curto 
43. a. 18,307 b. 3,940 c. 0,95 d. 0,10 


45. (3,6; 8,1); não 

47. a. 95% IC: (6,702; 9,456) b. (0,166; 0,410) 

49. a. Parece haver uma ligeira inclinação positiva na me- 
tade do meio da amostra, mas as suíças inferiores são 
mais longas do que as superiores. A extensão da varia- 
bilidade é muito substancial, embora não haja outliers. 

b. Sim. O padrão dos pontos em uma marcação de 
probabilidade normal é razoavelmente linear. 

c. (33,53; 43,79) 

51. a. (0,624; 0,732) b. 1.080 c. Não 
53. (-0,84, -0,16) 

55. 246 

57. atJÚ-Mr. Wan.2r) = (65,3; 232,5) 

59. a. (máx(jc,)/(l — a/2) 1 '" , máx(jc J )/(a/2) ,M ) 

b. (máx(jc,), máx(jc l )/a ,/ ") c. (b); (4,2; 7,65) 

61. (73,6; 78,8) versus (75,1; 79,6) 


Capítulo 8 

1. a. Sim b. Não c. Não 

d. Sim e. Não f. Sim 

5. // () : cr = 0,05 versus f/ a : a< 0,05. 1: conclui que a va- 
riabilidade na espessura é satisfatória quando de fato 
não é. II: conclui que a variabilidade na espessura não é 
satisfatória quando de fato é. 

7. I: concluindo que a usina não está em conformidade 
quando está; II: concluindo que a usina está em con- 
formidade quando não está. 

9. a. /?, b. I: julgando que uma das duas companhias 
é favorecida em relação à outra quando este não é o 
caso: II: julgando que nenhuma companhia é favorecida 
em relação a outra quando na realidade uma das duas é 
realmente a preferida. c. 0,044 

d. >3(0,3) = >3(0,7) = 0,488, /3<0,4) = /3(0,6) = 0,845 

e. Rejeitar H 0 em favor de H d . 

11. a. H 0 : /i = 10 versus H d : /i # 10 b. 0,01 

c. 0,5319; 0,0078 d. 2,58 

e. 10,1032 é substituído por 10,124, e 9,8968 é substi- 
tuído por 9,876. f . jc = 10,020, portanto H 0 não 

deve ser rejeitada. g» ^3 — 2,58 ou ^ -2,58 

13. b. 0,0004; 0; menor do que 0,01 
15. a. 0,0301 b. 0,003 c. 0,004 

17. a. z = 2,56 ^ 2,33; portanto rejeita H 0 . 

b. 0,8413 c. 143 d. 0,0052 

19. a. z = -2,27; portanto não rejeita H 0 . b. 0,2266 

c. 22 

21. a. t 0m 025.12 = 2,179 > 1,6; portanto não rejeita H 0 : fx = 
0,5. 


b. - 1,6 > -2,179; portanto não rejeita H 0 . 

c. Não rejeita H 0 . 

d. Rejeita H 0 em favor de H a : /z ^ 0,5. 

23. t = 2,24 > 1,708; portanto H 0 deve ser rejeitada. Os da- 
dos sugerem uma contradição da primeira hipótese. 

25. a. z = -3,33 < -2,58; portanto rejeita H 0 . 

b. 0,1056 c. 217 

27. —2,09 > —2,33; portanto não rejeita H 0 . 

29. a. 0,498 < 1,895; portanto não rejeita H 0 . b. 0,72 

31. -1,24 > —1,397; portanto a primeira hipótese não 
parece ter sido contradita 

35. Sim, porque -2,47 ^ -1,96. 

37. z = 3,67 > 2,58; portanto rejeita H 0 : p = 0,40. Não. 

39. -6,1 é muito menor do que -2,33; portanto os dados 
suportam fortemente esta conclusão. 

41. a. { 15, ..., 20} b. 0,021, sim c. 0,874; 0,196 

d. Usando R = { 14 20}, não. 

43. z = “0,61 > -2,33; não 

45. a. Não rejeita H {) . b. Não rejeita H 0 . 

c. Não rejeita // 0 . d. Rejeita H {) . 

e. Não rejeita H 0 . f. Não rejeita H 0 . 

47. a. 0,0358 b. 0,0802 c. 0,5824 

d. 0,1586 e. 0 

49. a. Valor P = 0,003 < 0,05; portanto rejeita H 0 . 

b. Valor P = 0,055 >0,01; portanto H () não pode ser 
rejeitada. 

c. Valor P > 0,5; portanto f/„ não pode ser rejeitada em 
qualquer a razoável. 


